Informations

Pourquoi y a-t-il des répétitions inversées dans les éléments de réponse ?


L'image suivante montre une séquence de répétition inversée dans un élément de réponse. Les séquences d'éléments de réponse pour les glucocorticoïdes, les œstrogènes et les hormones thyroïdiennes montrent qu'ils contiennent tous des répétitions inverses. Pourquoi ces répétitions inversées existent-elles dans autant de séquences de réponse ? En d'autres termes, quel avantage présentent-elles à la fonction de l'élément de réponse ?


En commençant par les facteurs de transcription procaryotes (c'est-à-dire bactériens) - qui ont été les premiers à être caractérisés en profondeur, ce type de modèle a été noté. Même pour les endonucléases de restriction de type II "classiques" utilisées pour le clonage moléculaire ont des séquences de reconnaissance palindromique. Dans les trois cas, la réponse est que la protéine de liaison à l'ADN spécifique à la séquence se lie comme un dimère, et donc chaque monomère reconnaît un "demi-site" (l'une des séquences inversées).


La translocation répétée d'une cassette de gène entraîne le renouvellement des chromosomes sexuels chez les fraises

Les rotations des systèmes de détermination du sexe représentent des forces de diversification importantes parmi les eucaryotes. Des changements dans les chromosomes sexuels, mais la conservation des gènes maîtres déterminant le sexe, caractérisent des lignées animales éloignées. Pourtant, chez les plantes, dans lesquelles les sexes séparés ont évolué à plusieurs reprises et les chromosomes sexuels sont généralement homomorphes, nous ne savons pas si de telles translocations entraînent des renouvellements de chromosomes sexuels au sein de groupes taxonomiques étroitement liés. Ce phénomène ne peut être démontré qu'en identifiant des séquences nucléotidiques associées au sexe, encore largement inconnues chez les plantes. Les fraises octoploïdes sauvages d'Amérique du Nord (Fragaria) présentent des sexes séparés (dioécie) avec un héritage hétérogamétique femelle (ZW) homomorphe, mais le sexe correspond à trois chromosomes différents dans différents taxons. Pour caractériser ces revirements, nous avons identifié des séquences uniques aux femelles et assemblé leurs lectures en contigs. Pour la plupart des octoploïdes Fragaria taxons, une courte séquence (13 kb) a été observée chez toutes les femelles et jamais chez les mâles, l'impliquant comme la région déterminant le sexe (SDR). Cette «cassette SDR» spécifique aux femmes contient à la fois un gène ayant un rôle connu dans la production de fruits et de pollen et un nouveau rétrogène absent sur les chromosomes Z et autosomiques. La comparaison phylogénétique des cassettes SDR a révélé trois clades et des antécédents de translocation répétée. Remarquablement, les translocations peuvent être ordonnées temporellement en raison de la capture d'une séquence adjacente à chaque mouvement successif. L'accumulation de la séquence "souvenir" - et l'expansion résultante du SDR hémizygote au fil du temps - aurait pu être adaptative en verrouillant les gènes en liaison avec le sexe. Les répétitions inversées terminales aux frontières d'insertion suggèrent un moyen de mouvement. À notre connaissance, il s'agit de la première SDR végétale à être transloquée et elle suggère un nouveau mécanisme (« move-lock-grow ») pour l'expansion et la diversification des chromosomes sexuels naissants.


Fond

Le génome humain présente un schéma complexe de duplications segmentaires (SD) très identiques et entrecoupées [1, 2] par opposition aux clusters SD en tandem et inversés qui prédominent dans la plupart des autres lignées de mammifères. Cette organisation prédispose notre espèce à des réarrangements à grande échelle dus à des croisements inégaux conduisant à une instabilité génomique notamment associée au retard neurodéveloppemental et à l'autisme. Paradoxalement, cette susceptibilité à la variation du nombre de copies et à la maladie semble avoir été compensée au cours de l'évolution par l'émergence de nouveaux gènes et transcrits spécifiques à l'homme [3] qui ont été associés à l'expansion du cortex préfrontal, à une néoténie neurale étendue, à une connectivité synaptique accrue, et d'autres adaptations humaines potentiellement uniques [4,5,6,7]. La nature incomplète et intercalée des SD a été la clé de leur innovation rapide, car les copies en double sont souvent situées dans de nouveaux contextes génomiques. Dans la plupart des cas, ils se juxtaposent à d'autres SD d'origine évolutive diverse qui portent différents éléments fonctionnels, créant un potentiel de régulation différentielle et de fusion des gènes dupliqués [8]. La base moléculaire de cette organisation modulaire parmi la lignée des primates est largement inconnue.

Les SD humaines sont organisées en 435 blocs de duplication estimés dont la taille varie de 50 kbp à plusieurs Mbp de longueur. Leur reconstruction ancestrale a révélé une organisation hautement non aléatoire en ce qui concerne à la fois la distribution chromosomique et leur structure. Les 435 blocs de duplication peuvent être regroupés en 24 clades/groupes distincts, qui sont en outre organisés autour d'un ensemble de 14 duplicons « core » ou germes surreprésentés [9]. Les noyaux représentent des points focaux pour l'expansion et la transposition en double des SD parmi les génomes des primates. Il est intéressant de noter que les duplicons de base sont transcriptionnellement actifs, codent pour des familles de gènes qui sont généralement considérées comme spécifiques ou étendues aux grands singes, et présentent souvent des signatures de sélection positive. Des données émergentes suggèrent que les noyaux ont subi une expansion indépendante et récurrente dans plusieurs lignées de primates et, dans certains cas, se démarquent aux points de rupture de grands événements récurrents de microdélétion/microduplication associés à un retard neurodéveloppemental [10, 11].

Le chromosome humain 16 est particulièrement enrichi en blocs de duplication intercalés. En effet, environ 10 % de la séquence euchromatique du bras court du chromosome 16 est composée de SD appelés LCR16 (low copy repeat on chr16) qui ont évolué au cours des 25 derniers millions d'années [12]. Nous avons précédemment identifié un duplicon central de 20 kpb (LCR16a) en association avec presque toutes les SD intercalées le long de chr16p. Intégrée dans LCR16a se trouve une famille de gènes identifiée comme une protéine interagissant avec un complexe de pores nucléaires (NPIP) (alias morphée). Les NPIP La famille de gènes est remarquable car elle présente certains des exemples les plus extrêmes de sélection positive jamais enregistrés [13]. De plus, la plupart des copies sont intercalées (par opposition à regroupées), et une analyse comparative des génomes humain et orang-outan a montré que l'expansion s'est produite indépendamment dans les deux lignées, y compris l'expansion vers des chromosomes non homologues [14]. La caractérisation de LCR16a chez les primates, cependant, a été entravée par son association avec de grandes régions dupliquées, qui sont rarement assemblées dans la plupart des génomes de référence des primates.

Dans cette étude, nous étudions systématiquement l'organisation de LCR16a plus largement à travers la phylogénie des primates en utilisant l'hybridation de bibliothèques génomiques pour découvrir et caractériser des loci génomiques largement absents ou effondrés dans les assemblées de référence actuelles. Nous trouvons des expansions indépendantes de LCR16a vers de nouvelles régions chromosomiques accompagnées de l'accumulation de séquences flanquantes, y compris chez des espèces de primates éloignées, telles que le ouistiti. L'analyse ciblée des transcrits dans différentes espèces montre un renouvellement rapide de la structure des gènes avec la perte et le gain d'exons entiers et de fusions de gènes spécifiques à chaque lignée. Nos résultats soutiennent fortement un modèle où LCR16a a indépendamment entraîné l'accumulation de SD de primates intercalés en conjonction avec l'évolution d'une famille de gènes transcrits subissant une forte évolution adaptative avec une fonction biologique encore inconnue.


Historique des modifications

Roulois, D. et al. Les agents de déméthylation de l'ADN ciblent les cellules cancéreuses colorectales en induisant un mimétisme viral par des transcrits endogènes. Cellule 162, 961–973 (2015).

Chiappinelli, K.B. et al. L'inhibition de la méthylation de l'ADN provoque une réponse d'interféron dans le cancer via l'ARNdb, y compris les rétrovirus endogènes. Cellule 162, 974–986 (2015).

Goel, S. et al. L'inhibition de CDK4/6 déclenche une immunité anti-tumorale. La nature 548, 471–475 (2017).

Sheng, W. et al. L'ablation du LSD1 stimule l'immunité anti-tumorale et permet le blocage des points de contrôle. Cellule 174, 549–563 (2018).

Cuellar, T.L. et al. Le silence des rétrotransposons par SETDB1 inhibe la réponse interféron dans la leucémie myéloïde aiguë. J. Cell Biol. 216, 3535–3549 (2017).

Guler, G.D. et al. La répression de l'expression de LINE-1 induite par le stress protège les sous-populations de cellules cancéreuses contre l'exposition mortelle aux médicaments. Cellule cancéreuse 32, 221–237 (2017).

Loo Yau, H., Ettayebi, I. & De Carvalho, D. D. L'épigénome du cancer : exploiter ses vulnérabilités pour l'immunothérapie. Tendances Cell Biol. 29, 31–43 (2019).

Jones, P. A., Ohtani, H., Chakravarthy, A. & De Carvalho, D. D. Thérapie épigénétique en immuno-oncologie. Nat. Rév. Cancer 19, 151–161 (2019).

Deaton, A. M. & Bird, A. Les îles CpG et la régulation de la transcription. Gènes Dev. 25, 1010–1022 (2011).

Levanon, E. Y. et al. Identification systématique des sites d'édition A-to-I abondants dans le transcriptome humain. Nat. Biotechnologie. 22, 1001–1005 (2004).

Liddicoat, B.J. et al. L'édition d'ARN par ADAR1 empêche la détection par MDA5 de l'ARNdb endogène en tant que non-soi. Science 349, 1115–1120 (2015).

Leruste, A. et al. Les cellules T expansées par clonage révèlent l'immunogénicité des tumeurs rhabdoïdes. Cellule cancéreuse 36, 597–612 (2019).

Krug, B. et al. L'acétylation omniprésente de H3K27 conduit à l'expression de l'ERV et à une vulnérabilité thérapeutique dans les gliomes H3K27M. Cellule cancéreuse 35, 782–797 (2019).

Ahmad, S. et al. La violation de l'auto-tolérance à l'ARN duplex Alu sous-tend l'inflammation médiée par MDA5. Cellule 172, 797–810 (2018).

Chung, H. et al. L'ADAR1 humain empêche l'ARN endogène de déclencher l'arrêt de la traduction. Cellule 172, 811–824 (2018).

Deininger, éléments P. Alu : connaître les SINE. Génome Biol. 12, 236 (2011).

Iorio, F. et al. Un paysage des interactions pharmacogénomiques dans le cancer. Cellule 166, 740–754 (2016).

Skene, P. J. & amp Henikoff, S. Une stratégie de nucléase ciblée efficace pour la cartographie haute résolution des sites de liaison à l'ADN. eLife 6, e21856 (2017).

Gruber, A.J. et al. Une analyse complète des ensembles de données de séquençage de l'extrémité 3' révèle de nouveaux signaux de polyadénylation et le rôle répressif de la ribonucléoprotéine C hétérogène sur le clivage et la polyadénylation. Génome Res. 26, 1145–1159 (2016).

Samuel, C. E. Les adénosines désaminases agissant sur l'ARN (ADAR) sont à la fois antivirales et provirales. Virologie 411, 180–193 (2011).

Hou, F. et al. MAVS forme des agrégats fonctionnels de type prion pour activer et propager la réponse immunitaire innée antivirale. Cellule 146, 448–461 (2011).

Issa, J.P. & Kantarjian, H.M. Ciblage de la méthylation de l'ADN. Clin. Cancer Res. 15, 3938–3946 (2009).

Ishizuka, J.J. et al. La perte d'ADAR1 dans les tumeurs surmonte la résistance au blocage des points de contrôle immunitaire. La nature 565, 43–48 (2019).

Gannon, H.S. et al. Identification de la dépendance à l'adénosine désaminase ADAR1 dans un sous-ensemble de cellules cancéreuses. Nat. Commun. 9, 5450 (2018).

Kreso, A. et al. L'auto-renouvellement comme cible thérapeutique dans le cancer colorectal humain. Nat. Moyenne. 20, 29–36 (2014).

Saito, Y. et al. L'inhibition de la méthylation de l'ADN supprime les organoïdes tumoraux intestinaux en induisant une réponse antivirale. Sci. Représentant. 6, 25311 (2016).

Lima-Fernandes, E. et al. Le ciblage de la bivalence dé-réprime le hérisson indien et inhibe l'auto-renouvellement des cellules initiatrices du cancer colorectal. Nat. Commun 10, 1436 (2019).

Dobin, A. et al. STAR : aligneur universel ultrarapide RNA-seq. Bioinformatique 29, 15–21 (2013).

Li, H. et al. Le format Sequence Alignment/Map et SAMtools. Bioinformatique 25, 2078–2079 (2009).

Liao, Y., Smyth, G. K. & amp Shi, W. featureCounts : un programme efficace à usage général pour attribuer des lectures de séquences aux caractéristiques génomiques. Bioinformatique 30, 923–930 (2014).

Pertea, M. et al. StringTie permet une reconstruction améliorée d'un transcriptome à partir de lectures d'ARN-seq. Nat. Biotechnologie. 33, 290–295 (2015).

Jun, G., Wing, M. K., Abecasis, G. R. & Kang, H. M. Un cadre d'analyse efficace et évolutif pour l'extraction et le raffinement de variantes à partir de données de séquence d'ADN à l'échelle de la population. Génome Res. 25, 918–925 (2015).

Narasimhan, V. et al. BCFtools/RoH : une approche de modèle de Markov caché pour détecter l'autozygotie à partir de données de séquençage de nouvelle génération. Bioinformatique 32, 1749–1751 (2016).

Quinlan, A. R. & Hall, I. M. BEDTools : une suite flexible d'utilitaires pour comparer les caractéristiques génomiques. Bioinformatique 26, 841–842 (2010).

Chen, S., Zhou, Y., Chen, Y. & Gu, J. fastp : un préprocesseur FASTQ tout-en-un ultra-rapide. Bioinformatique 34, i884–i890 (2018).

Skene, P. J., Henikoff, J. G. & Henikoff, S. Profilage in situ ciblé à l'échelle du génome avec une efficacité élevée pour un faible nombre de cellules. Nat. Protocole. 13, 1006–1019 (2018).

Zhang, Y. et al. Analyse basée sur un modèle de ChIP-Seq (MACS). Génome Biol. 9, R137 (2008).

Ramirez, F. et al. deepTools2 : un serveur Web de nouvelle génération pour l'analyse de données de séquençage en profondeur. Acides nucléiques Res. 44, W160–W165, (2016).

Kwon, M. & Firestein, B.L. Transfection d'ADN : méthode au phosphate de calcium. Méthodes Mol. Biol. 1018, 107–110 (2013).

Halfmann, R. & Lindquist, S. Dépistage de l'agrégation amyloïde par électrophorèse sur gel d'agarose-détergent semi-dénaturant. J. Vis. Exp. 17, e838 (2008).

Ettayebi, I., Yau, H. L. & De Carvalho, D. D. Méthodes pour détecter l'induction et la reconnaissance endogènes d'ARNdb. Méthodes Enzymol. 629, 35–51 (2019).

Teissandier, A., Servant, N., Barillot, E. & Bourc'his, D. Outils et bonnes pratiques pour l'analyse des rétrotransposons à partir de données de séquençage haut débit. Foule. ADN 10, 52 (2019).

Sergushichev, A. A. Un algorithme pour une analyse rapide de l'enrichissement de l'ensemble de gènes à l'aide d'un calcul de statistiques cumulatives. Préimpression sur https://doi.org/10.1101/060012 (2016).

Hu, Y. & Smyth, G. K. ELDA : analyse de dilution limite extrême pour comparer les populations appauvries et enrichies dans les cellules souches et d'autres tests. J. Immunol. Méthodes 347, 70–78 (2009).


Résultats

Le système génétique qui nous a conduit à la découverte de la fusion répétée inversée est illustré à la figure 1A (Carson et Hartwell 1985 Admire et al. 2006). En bref, nous avons construit une souche de levure haploïde qui contient une copie supplémentaire de ChrVII (une souche disomique). Toute modification de ce chromosome supplémentaire ne devrait pas compromettre la viabilité cellulaire en soi. Les CAN1 Le gène, inséré près du télomère gauche du chromosome supplémentaire, permet d'identifier les cellules présentant des modifications chromosomiques. CAN1 code l'arginine perméase qui importe l'arginine ainsi que l'analogue toxique canavanine uniquement les cellules qui perdent le CAN1 gène peut se développer dans des milieux contenant de la canavanine (formant des colonies Can R). À l'aide de plusieurs marqueurs génétiques, nous avons détecté trois types de changements chromosomiques dans les colonies Can R : la perte de chromosomes entiers, la recombinaison allélique normale et d'autres réarrangements complexes qui donnent lieu à des colonies d'apparence sectorielle (que nous appelons « colonies mixtes » x0201d) (Fig. 1A). (mutations ponctuelles dans CAN1 se produisent plus rarement [Weinert et Hartwell 1990.]) Les colonies Can R mixtes contiennent des cellules de plusieurs génotypes, alors que les colonies Can R normales contiennent des cellules d'un seul génotype (voir Matériels et méthodes). Auparavant, nous pouvions déduire qu'une colonie mixte naît d'une cellule avec un chromosome instable, alors qu'une colonie normale naît d'une cellule avec un chromosome stable (Admire et al. 2006).

L'objectif initial de cette étude est de déterminer la nature du chromosome instable qui forme des colonies mixtes. Nous avons utilisé rad9 mutants ici simplement comme un outil pour étudier les chromosomes instables, car les chromosomes instables se forment plus fréquemment dans rad9 mutants que dans les cellules de type sauvage (Rad + ) (Admire et al. 2006 cette étude). Nous soulignons que des chromosomes instables se forment également chez d'autres mutants (certains à une fréquence encore plus élevée que dans rad9 mutants) (voir ci-dessous).

Un indice majeur pour résoudre la structure du chromosome instable provenait de la structure d'une translocation spécifique (la translocation �lta 7/Delta 11” [D7/D11]) présente uniquement dans les colonies mixtes (Fig. 1B). Nos analyses précédentes ont suggéré que cette translocation résulte probablement de plusieurs événements de délétion et de fusion centrés sur un site à 403 kb de l'extrémité gauche (Fig. 1B Admire et al. 2006). Ce site ChrVII 403 contient des séquences de répétition terminale longue (LTR) ainsi que des gènes d'ARNt qui semblent contribuer à l'instabilité (Admire et al. 2006 H Jones et T Weiner, inédit). Les LTR sont dérivés de rétrotransposons (Kim et al. 1998) et sont présents en centaines de copies dans le génome de la levure. (Les répétitions Sigma 2 [S2] et Sigma 3 [S3] sont dérivées des éléments Ty3, ont une longueur de 278 et 245 bases, partagent 82% d'identité et sont distantes de 3,3 kb, tandis que D7 et D11 proviennent de Ty1, sont toutes deux 331 bases , partagent 97 % d'identité et sont distants de 133 ko.) Étant donné la structure de la translocation D7/D11, nous suggérons un modèle relativement simple dans lequel un événement fusionne les répétitions inversées S2 et S3 pour générer un chromosome dicentrique, illustré à la figure 1B , et un second événement fusionne les répétitions directes D7 et D11 pour résoudre le dicentrique et former la translocation. Nous testons d'abord l'hypothèse qu'un intermédiaire dicentrique est impliqué dans l'instabilité de ChrVII.

Un dicentrique spécifique est présent dans les cellules qui forment des colonies mixtes

Nous avons utilisé un test PCR pour tester la présence du dicentrique spécifique (Fig. 2A). Nous avons pensé que le dicentrique, s'il était formé, pourrait être présent en une quantité faible mais détectable dans une culture de cellules, et que la quantité de dicentrique pourrait prédire la fréquence des colonies mixtes Can R provenant de cette culture. Nous avons donc grandi (en rich media) chacun de 10 single rad9 cellules (contenant initialement un ChrVII non réarrangé) en 10 cultures indépendantes (d'abord en colonies sur plaques, puis chacune en culture liquide). Nous avons ensuite effectué deux tests sur chacune de ces 10 cultures. Nous avons isolé l'ADN génomique de chaque culture et l'avons soumis à une amplification en utilisant des amorces qui devraient détecter le chromosome dicentrique spécifique (Fig. 2A). En fait, nous avons détecté un fragment PCR spécifique de la taille et de la séquence correctes si les répétitions inversées S2 et S3 fusionnaient pour former le dicentrique (voir la figure supplémentaire S1 pour la séquence). Les réactions de PCR de contrôle n'ont pas réussi à amplifier le même fragment d'ADN à partir des séquences du site ChrVII 403 natif (les séquences natives ont été faites par PCR-amplifiant le site ChrVII 403) (données non présentées). (Nous notons que ces amorces PCR amplifieraient le même fragment d'ADN s'il survenait par un événement d'inversion, possibilité formelle que nous éliminons par des tests génétiques et moléculaires [Fig. supplémentaire S2 voir ci-dessous]).

La fusion répétée inversée génère des dicentriques qui provoquent une instabilité chromosomique supplémentaire. (UNE) Les structures de ChrVII normal et du dicentrique putatif sont montrées avec les positions des amorces PCR 1 et 2 utilisées pour détecter la présence du dicentrique. (B) ADN génomique de cultures non sélectionnées de Rad + , rad9, et rad51 ont été soumis à une amplification par PCR en utilisant les amorces 1 et 2. Les gels présentent des résultats de PCR qualitatifs. Les rad9 les cultures ont également été analysées pour leurs fréquences de colonies mixtes et une PCR quantitative pour déterminer la quantité de dicentrique. Un test de corrélation de Spearman a été réalisé pour corréler l'instabilité et les dicentriques. Le coefficient de corrélation de rang de Spearman (ρ) est de 0,973 P-valeur, π.0001. (voies 4,8,9) Trois des cultures Rad + sont faiblement positives pour le fragment dicentrique. Amorces à RSP5 ont été utilisés comme contrôles PCR.

Nous avons ensuite testé si la quantité de produit PCR était en corrélation avec la fréquence des colonies mixtes dans les 10 cultures. Si tel est le cas, les cultures contenant quantitativement plus de produit PCR devraient donner lieu à davantage de colonies mélangées.Nous avons déterminé la quantité de dicentriques par PCR quantitative et la fréquence des colonies mixtes par un test génétique quantitatif (voir Matériel et méthodes). Nous avons constaté qu'en fait, les cultures qui avaient plus de dicentriques donnaient lieu à une fréquence généralement plus élevée de colonies mixtes (coefficient de corrélation 0,97 P < 0,001) (Fig. 2B). La concentration de dicentriques variait entre les cultures, avec une moyenne d'environ un en 2000 rad9 cellules (et une cellule sur 100 000 dans les cellules Rad +) (Fig. supplémentaire S3).

Nous avons également testé la corrélation entre la quantité de produit PCR et l'instabilité en étudiant des souches à faible instabilité (Rad +, cellules de type sauvage) et à forte instabilité (rad51 mutants avec un défaut de recombinaison homologue [HR]) (Fig. 2B discuté plus en détail ci-dessous). Encore une fois, nous avons trouvé un produit PCR plus dicentrique dans rad51 mutants à forte instabilité que dans les souches Rad + à faible instabilité (Fig. 2B). Nous observons également cette corrélation chez d'autres mutants (voir ci-dessous). Nous concluons que le dicentrique spécifique représenté sur les figures 1B et ​ et 2A 2A est très probablement un intermédiaire clé à l'instabilité et à la formation de la translocation spécifique D7/D11 illustrée à la figure 1B.

Le test génétique confirme que les dicentriques provoquent l'instabilité dans les colonies mixtes

Bien que les résultats du test PCR décrit ci-dessus soutiennent fortement qu'un dicentrique spécifique provoque une instabilité, nous ne pouvons pas détecter directement les chromosomes dicentriques intacts (en raison de leur fragilité et de leur faible abondance). Nous nous sommes donc tournés vers une approche génétique pour tester si les dicentriques sont, en fait, des intermédiaires dans l'instabilité.

Notre test génétique utilise un mutant thermosensible d'une protéine kinétochore, ctf13-30, qui fonctionne correctement à 23ଌ mais pas à 36ଌ (Doheny et al. 1993). Ctf13 relie les microtubules au kinétochore. L'idée d'utiliser ce mutant est la suivante : lorsqu'un dicentrique subit une ségrégation chromosomique pendant la mitose et que Ctf13 est actif, l'ADN se brisera, mais si Ctf13 est inactif, la connexion microtubule–kinétochore se brisera à la place de l'ADN ( Fig. 3A ) . (La rupture de l'ADN est nécessaire pour former des colonies mixtes, car les colonies mixtes contiennent des cellules de plusieurs génotypes.) Nous avons donc prédit que le statut Ctf13 affectera la fréquence des colonies mixtes si les dicentriques sont des intermédiaires, alors que le statut Ctf13 n'affectera pas la fréquence des colonies mixtes si les dicentriques ne sont pas des intermédiaires. Pour tester cette prédiction, nous avons développé rad9 et rad9 ctf13-30 cellules à la température permissive (23ଌ) ou restrictive (36ଌ), et déterminé le niveau de dicentriques par PCR quantitative et le niveau d'instabilité à partir de la fréquence des colonies mixtes (Fig. 3B). (Nous avons constaté que le statut de Ctf13 n'affectait pas considérablement la quantité de dicentriques formés, tel que mesuré par PCR quantitative, il y a une multiplication par quatre des dicentriques dans les cellules défectueuses de Ctf13.) Nous avons constaté que le statut de Ctf13 affectait, en fait, l'instabilité rad9 ctf13-30 les mutants avaient une fréquence huit fois inférieure de colonies mixtes lorsqu'ils étaient cultivés à une température restrictive par rapport à la température permissive, et par rapport à rad9 CTF13 + souches cultivées à l'une ou l'autre température. Ainsi, la quantité de dicentrique formée était largement indépendante de l'activité de Ctf13 (il y a en fait plus de dicentrique dans les cellules défectueuses en Ctf13), mais la sort des dicentriques dépendait du statut Ctf13 (moins de colonies mixtes dans les cellules défectueuses en Ctf13). Ce résultat Ctf13 est cohérent avec l'hypothèse selon laquelle le dicentrique spécifique détecté par PCR est un intermédiaire à l'instabilité.

L'instabilité est affectée par la protéine Ctf13, suggérant que les dicentriques sont des intermédiaires dans l'instabilité. (UNE) Modèle de la façon dont la fonction Ctf13 peut affecter le destin d'un chromosome dicentrique. Voir le texte pour la discussion. (B) rad9 et rad9 ctf13-30 les souches ont été cultivées à des températures permissives (23 ° x 000b0C) ou restrictives (36 ° x 000b0C), puis analysées pour les événements d'instabilité, les translocations et la fréquence des dicentriques par PCR quantitative comme décrit dans les matériaux et méthodes.

On remarque que rad9 ctf13-30 les cellules ont une fréquence plus élevée de perte chromosomique et de recombinaison allélique lorsqu'elles sont cultivées à la température restrictive par rapport à la température permissive, comme indiqué précédemment (Fig. 3B Doheny et al. 1993). Une augmentation de la perte de chromosomes était attendue à partir du modèle de désagrégation des dicentriques et est perdue lorsque la connexion du kinétochore Ctf13 se rompt. La fréquence plus élevée de recombinaison allélique dans ctf13-des cellules défectueuses ont également été signalées pour les chromosomes monocentriques dans les deux ctf13-cellules défectueuses (Doheny et al. 1993) et pour les cellules traitées avec l'inhibiteur des microtubules bénomyl (Wood et Hartwell 1982). La cause de l'augmentation de la recombinaison allélique dans l'une de ces études est inconnue, mais il est peu probable qu'elle soit due à un comportement dicentrique (voir la discussion supplémentaire Fig. S4).

En somme, nous concluons que les répétitions inversées dans le site ChrVII 403 fusionnent pour former un dicentrique qui provoque l'instabilité évidente dans les colonies mixtes. Nous montrons ensuite que la fusion de répétitions inversées proches est un phénomène général dans le génome de la levure.

La fusion par paire de nombreuses répétitions inversées à proximité dans le génome de la levure

Pour tester si la fusion répétée inversée est générale, nous avons à nouveau utilisé un test basé sur la PCR. En examinant le génome de la levure, nous avons découvert qu'il existe des sites � dans la levure en herbe qui contiennent des répétitions inversées LTR flanquées de gènes d'ARNt, une géométrie similaire à celle du site instable ChrVII 403 (Fig. 4A). Nous avons choisi cinq de ces sites pour tester leur fusion de répétitions inversées. Nous avons isolé l'ADN génomique des cellules et l'avons soumis à une amplification par PCR en utilisant des amorces appropriées (comme sur la figure 2A). Nous avons développé des ensembles séparés d'amorces qui pourraient détecter des acentriques ou des dicentriques, puisque théoriquement l'un ou l'autre est également possible (voir Fig. 4D). Nous avons détecté des fragments d'ADN diagnostiques de chromosomes acentriques et/ou dicentriques sur les cinq sites génomiques testés (Fig. 4B). Pour avoir une idée de la fréquence à laquelle ces autres répétitions inversées proches fusionnent, nous avons effectué une PCR quantitative sur deux sites supplémentaires (ChrVI 160 et ChrX 542, en plus du ChrVII 403) et avons constaté que la fréquence des événements de fusion dans les souches Rad + à les trois sites étaient comparables (1,5 × 10 𢄥 , 4,7 × 10 𢄥 et 8,1 × 10 𢄥 pour les trois sites, respectivement) (voir Fig. S5I supplémentaire).

Les répétitions inversées sur cinq sites du génome de la levure fusionnent pour former des dicentriques et/ou des acentriques. (UNE) Les sites criblés pour la fusion contiennent des gènes d'ARNt (pentagones), des séquences répétées (les flèches grises et brunes sont impliquées dans la réaction de fusion, alors que les claires ne le sont pas) et, dans un cas, une origine (carré). La fusion répétée inversée forme des fragments dicentriques ou acentriques en utilisant des amorces dans les schémas illustrés dans C. (B) Des fragments d'ADN sont détectés sur les cinq sites testés, en utilisant des amorces appropriées spécifiques à chaque site. Les séquences d'amorces sont dans la figure supplémentaire S9. L'analyse de trois sites a donné des fragments acentriques et dicentriques. Les astérisques indiquent où les fragments d'ADN auraient dû apparaître, s'ils se sont formés. La séquence d'ADN de tous les fragments d'ADN a été confirmée (Fig. supplémentaire S5). (C) Si les jonctions de fusion pour les chromosomes acentriques et dicentriques sont identiques, alors elles pourraient avoir surgi par un mécanisme symétrique. Ce mécanisme peut conceptuellement être considéré comme un croisement représenté ici, un événement génère à la fois des acentriques et des dicentriques. (Les fourches bloquées ne sont pas représentées ici en tant qu'intermédiaires, ce diagramme est destiné à transmettre l'idée d'un événement symétrique uniquement.) () D'autre part, si les jonctions de fusion pour les chromosomes acentriques et dicentriques ne sont pas identiques, alors nous en déduisons que les acentriques et les dicentriques doivent être formés par des événements séparés. Dans ce cas, l'ADN polymérase "saute" entre différentes séquences pour former des acentriques que pour former des dicentriques. Notez que des articulations symétriques peuvent également être formées par un mécanisme asymétrique, si les ADN polymérases pour les séquences acentriques et dicentriques sautent entre des séquences identiques.

En examinant la séquence d'ADN des paires fusionnées de répétitions inversées, nous pouvons déduire certaines caractéristiques du ou des mécanismes de fusion. Tout d'abord, nous avons constaté que la fusion implique toujours une certaine homologie de séquence. comme 148 bases d'homologie exacte (ChrVII 403 dicentrique) (résumé dans la figure supplémentaire S5H). Les tests génétiques décrits ci-dessous sont cohérents avec l'implication d'une homologie limitée dans les réactions de fusion.

Deuxièmement, nous avons constaté que la fusion de répétitions inversées peut se produire entre des répétitions distantes de 5,4 kb les unes des autres (site ChrX 542) (Fig. supplémentaire S5H). Étant donné que ce site avait la plus grande distance entre les deux répétitions et formait toujours facilement des chromosomes dicentriques et acentriques, il est probable que la distance maximale de fusion soit plus grande (Fig. supplémentaire S5I). Les exigences de distance pour la fusion feront l'objet d'une étude future.

Troisièmement, nous avons trouvé des preuves qui portent sur la question de savoir si un événement génère à la fois un chromosome acentrique et dicentrique (Fig. 4C), ou si un événement génère un chromosome acentrique ou dicentrique mais pas les deux (Fig. 4D). Nous appelons ces deux options des événements “symmetric” et 𠇊symétrique”, respectivement. L'évidence qui porte sur cette question vient de la séquence des jonctions de fusion pour les sites où se forment à la fois des chromosomes acentriques et dicentriques. Étonnamment, nous avons constaté que, pour deux d'entre eux (ChrVII 403 et ChrV 137b), la jonction de fusion dans le produit acentrique était différente du produit dicentrique (en utilisant différentes bases dans les répétitions, comme illustré dans les séquences réelles de la figure 4D dans les figures supplémentaires. S1, S5). Pour le site ChrVII 403, nous avons trouvé que 16 des 16 acentriques utilisaient la même séquence (dans les 8 bases d'homologie entre S2 et S3), alors que 13 des 13 dicentriques analysés utilisaient une séquence différente (dans les 150 bases d'homologie entre S2 et S3) . Pour le troisième site (ChrX 542), la fusion pour former des acentriques et des dicentriques se produit dans la même séquence (comme sur la figure 4C), il existe donc une possibilité formelle que, pour ce site, les acentriques et les dicentriques soient générés par un seul événement. La formation de chromosomes acentriques et dicentriques par un événement asymétrique a des implications mécanistes qui sont abordées dans la discussion.

Les répétitions inversées synthétiques fusionnent également pour former des dicentriques associés à l'instabilité

Pour tester davantage la généralité de la réaction de fusion, nous avons généré une répétition inversée synthétique constituée de séquences non-LTR (tous les événements analysés jusqu'à présent contiennent des séquences LTR). Cette répétition inversée synthétique ne contient pas non plus de gènes d'ARNt susceptibles de contribuer à l'instabilité. Nous avons divisé le URA3 gène en trois fragments, chaque paire de fragments consécutifs partageant � pb d'homologie de séquence (désigné par “UR,” “RA,” et �”) (Fig. 5A Fig. S6). Nous avons d'abord inséré le URA3 modules dans les sites ChrVII qui forment la translocation dicentrique et D7/D11 (les sites 403 et 535, respectivement) (voir les figures 1B, ​, 5A). 5A). Nous avons permis l'instabilité de ces cellules génétiquement modifiées, identifié des colonies mixtes par sélection pour Can R et analysé les cellules dans les colonies mixtes pour URA3-événements médiatisés. Dans l'ensemble, nous avons constaté que le URA3-les événements médiés étaient pratiquement identiques aux événements médiés par le RLT. Tout d'abord, nous avons constaté que le URA3 des répétitions inversées contenant des séquences ont formé des chromosomes dicentriques, tout comme les séquences LTR S2 et S3 l'avaient fait (figure 5B). Deuxièmement, le URA3 L'intermédiaire dicentrique était fréquemment résolu pour former une translocation (Fig. supplémentaire S7), tout comme avec le dicentrique contenant LTR. Comme discuté plus loin, nous avons également constaté que les exigences génétiques pour la fusion de la URA3-les répétitions inversées à base de répétitions sont les mêmes que pour la fusion des répétitions S2 et S3 (aucune des deux réactions ne nécessite la RAD52 ou RAD59 gènes) (Fig. 5B voir ci-dessous).

Les répétitions inversées synthétiques fusionnent pour former des dicentriques, puis se recombinent pour former des translocations. (UNE) Trois segments de la URA3 gène ont été clonés en deux modules (voir la figure supplémentaire S6 pour les détails de la construction du module et de l'insertion des chromosomes). Les deux modules ont ensuite été insérés dans les sites spécifiques de ChrVII comme indiqué. La recombinaison répétée inversée relie les modules UR aux modules RA via la recombinaison de séquences partagées “R” pour former un dicentrique. Un deuxième événement de recombinaison joint 𠇊” à �” pour former un URA3 gène, rendant les cellules Ura + . (B) Chaque rad9 souche contient un module UR ou RA dans l'un des trois sites sur le bras gauche de ChrVII, et toutes les souches contiennent le module A3 sur un site sur le bras droit. Les modules UR diffèrent par la quantité d'homologie de séquence partagée avec le module RA (la taille de “R” est de 200, 60, 20 ou 0 pb d'homologie, comme indiqué). Chaque modifié rad9 souche a été analysée pour la présence du fragment PCR spécifique diagnostique d'un chromosome dicentrique, dans quatre cultures indépendantes, en utilisant des amorces URA dicentriques (Fig. supplémentaire S9). Des colonies mixtes Can R ont été générées à partir de chaque rad9 souche, et la fréquence des cellules Ura + dans les cellules de colonies mixtes a été déterminée (voir les matériels et méthodes). (**) La fréquence des colonies Ura + dans les cellules Can s est indiquée dans la figure supplémentaire S8.

Nous avons également utilisé le module de répétition inversée synthétique pour tester si la fusion est, pour une raison quelconque, contrainte à se produire dans le site ChrVII 403. Nous avons inséré le module de répétition inversée synthétique dans deux sites ChrVII supplémentaires (les sites ChrVII 110 et ChrVII 461) qui ne contiennent pas de fragments LTR, ne contiennent pas de gènes d'ARNt et se trouvent dans des régions complètement différentes du chromosome (un à 110 kb du télomère , et l'autre 37 ko du centromère). Nous avons pu identifier URA3-contenant des dicentriques formés sur les deux sites (Fig. 5B), confirmant que la fusion répétée inversée à proximité est un phénomène général. Ces études montrent que la fusion de répétitions inversées proches n'est pas limitée à des types de séquences d'ADN, à des séquences proches de gènes d'ARNt ou à des régions spécifiques d'un chromosome. (Nous avons également identifié des translocations Ura +, formées par résolution du dicentrique, à partir de modules Ura insérés au site ChrVII 461 mais pas au site ChrVII 110, résultat pour lequel nous n'avons aucune explication).

Enfin, nous avons utilisé le module de répétition inversée synthétique pour réexaminer le degré d'homologie de séquence nécessaire pour former des dicentriques. Nous avons trouvé que 60 bases d'homologie, mais pas 20 ou 0, permettaient la formation dicentrique (Fig. 5B). En somme, les longueurs d'homologie impliquées dans la fusion répétée inversée LTR et URA3 sont cohérentes avec des homologies de 60 bases et plus et, dans certains cas, aussi peu que 20 pb subissant une fusion.


Résultats

Caractérisation des séquences itérées dans le génome de Nostoc

Costa et al. (2002) ont rapporté les séquences de l'intron tRNA Leu (UAA) de 54 isolats de Nostoc. Parmi ceux-ci, huit possèdent des segments interrompant une région d'heptamères répétés en tandem, six des segments étant uniques. Des correspondances ont été trouvées avec cinq des segments uniques du génome de N. punctiforme, aucun dans l'intron. Aucune correspondance n'a été trouvée pour un sixième segment unique, 42 nt dans l'intron de Nostoc souche Nos20, et elle n'a pas été examinée plus avant dans cette étude. Les résultats de ces recherches sont discutés ci-dessous et résumés dans la Figure 1 et les Figures supplémentaires 1𠄸. Des représentations graphiques des matchs sous forme de logos de séquence sont données dans la figure supplémentaire 9.

Instances courantes d'éléments SDR. Familles : Les exemples les plus représentatifs sont présentés des membres de différentes familles d'éléments SDR et de leurs sous-familles. Toutes les familles avec au moins quatre occurrences dans le génome de Nostoc punctiforme sont donnés, ainsi que des exemples de chaque génome cyanobactérien considéré (énuméré dans la figure 5 ) dans lequel une instance de l'élément SDR a été observée (voir les fichiers supplémentaires 1𠄸 pour des listes plus complètes). Le nom de chaque organisme est suivi d'une fraction constituée du nombre d'instances de l'élément SDR dans le chromosome divisé par le nombre total d'instances. Seul le total est donné pour les organismes dont les séquences génomiques n'ont pas été complètement déterminées. Éléments SDR identifiés dans l'étude de l'intron tRNA Leu (UAA) de différents Nostoc (Costa et al. 2002) sont également présentées. Conventions de couleur : chaque élément SDR est mis en évidence avec une couleur caractéristique, également utilisée dans d'autres figures. Les écarts par rapport à la séquence de référence du groupe sont indiqués par une surbrillance grise. Les éléments SDR à proximité sont également mis en évidence dans leur couleur caractéristique. Pour ces éléments, une police verte ou noire est utilisée si l'orientation de l'élément est la même que l'élément central, sinon une police rouge ou italique est utilisée. Les séquences en italique et en caractères rouges font partie de minitransposons putatifs. Les blocs à l'extérieur de l'élément central surlignés en gris sont des séquences sans nom trouvées plusieurs fois dans le génome. Les séquences répétées en tandem à proximité sont colorées et en gras, et les unités répétées sont séparées par des barres verticales. Les barres verticales marquent également la fin des éléments SDR. Les répétitions en tandem avec des lignes qui les traversent sont l'inversion de répétitions représentées par la même couleur. Répétitions inversées : les traits de soulignement indiquent les régions potentiellement impliquées dans l'appariement de l'auto-base et les flèches étendues au Haut du groupement indiquent si l'appariement est fortement soutenu par une mutation compensatoire (flèches pleines) ou non (flèches brisées).

Caractérisation de SDR1

Une recherche lâche du N. punctiforme génome initié avec les segments identiques interrompant les introns ARNt Leu (UAA) de Nostoc Nos30 et Nos54 ont mis en lumière une famille large et diversifiée de séquences de 24 nt nommées SDR1 (pour une petite répétition dispersée, voir Discussion). Les membres de la famille les plus fréquemment rencontrés sont illustrés à la figure 1. La recherche initiale, basée sur le pourcentage d'identité (voir Méthodes), a conduit à ces sous-familles de séquences étiquetées SDR1.1 à SDR1.6, apparaissant dans le Nostoc génome jusqu'à 10 fois. Une liste plus complète est fournie dans la Figure 1 supplémentaire.

Les six sous-familles partagent un noyau conservé de neuf nucléotides ou 10 (GAGCG.AG.CGA), si SDR1.3 est exclu.Ce noyau est flanqué d'une répétition inversée de 4 nt, à nouveau à l'exclusion de SDR1.3, soutenue par un modèle de mutations compensatoires aux positions 5𠄹 et 21�. Pour évaluer l'importance de la répétition inversée, nous avons recherché dans le génome toutes les instances du motif de base de 10 nt et examiné les séquences flanquantes (tableau 1). Beaucoup plus d'instances du motif de base ont été trouvées que prévu par hasard, et parmi les nouvelles instances, 77% étaient flanquées de répétitions inversées de 4 nt de diverses séquences. Aucun ne serait attendu par hasard, et nous prenons ces résultats, ainsi que le biais marqué vers les substitutions appariées GT par rapport aux substitutions appariées AC pour indiquer que la sélection agit sur un polynucléotide simple brin, vraisemblablement de l'ARN transcrit à partir de SDR1, capable d'appariement de bases interne. Avec SDR1 redéfini comme possédant le noyau de 10 nt et des répétitions inversées flanquantes, nous avons trouvé 11 sous-familles avec au moins quatre membres (Fig. 1). La définition exclut le SDR1.3. Ce cas et d'autres cas particuliers sont discutés plus loin.

Tableau 1.

Paires palindromiques dans les instances de SDR1 trouvées par modèle

a Une séquence trouvée par le motif . . . . (. . . .)GCGAG.AG.CGA(. . . .), où une période est satisfaite par n'importe quel nucléotide, est compté comme “paired” si les deux tétranucléotides entre parenthèses peuvent s'apparier l'un avec l'autre soit en utilisant appariement de base conventionnel ou permettant un appariement GT ou AC. Aucune instance avec appariement GT ou AC n'avait plus d'une telle paire.

b Le nombre attendu est : longueur (s 7 w 3 ), où longueur est la longueur du N. punctiforme génome (9,1 Mbp), s est la fraction de G et la fraction de C dans le génome (0,21), et w est la fraction de A et la fraction de T (0,29). La probabilité qu'un tétramère aléatoire s'apparie exactement avec un autre tétramère aléatoire est de 0,4 %. La même probabilité permettant l'appariement GT à n'importe quelle position ou AT pairi006Eg à n'importe quelle position est de 2,0 %.

c Les instances SDR1 trouvées par le modèle ont été divisées en deux groupes : (1) celles qui avaient été précédemment trouvées par similarité globale, comme décrit dans la section Méthodes, et (2) celles qui n'avaient pas été trouvées par ce moyen.

Il existe de rares cas où la répétition inversée de 4 nt est considérablement étendue. Dans Crocosphaera watsonii, six instances de SDR1 ont la répétition inversée de 4 nt prolongée de neuf nucléotides complémentaires supplémentaires dans chaque direction, une conclusion étayée par des mutations compensatoires (Fig. 1 supplémentaire). Des extensions similaires peuvent être vues avec des instances de SDR1 dans Anabaena PCC 7120 et Nodulaire CCY9414, mais nous n'avons vu aucune de ces extensions dans les nombreuses instances de SDR1 dans Nostoc.

Caractérisation du SDR2

Les séquences identiques de Nostoc Nos37 et Nos38 qui interrompent leurs introns ARNt Leu ont été utilisés pour rechercher le Nostoc génome, produisant une famille de séquences, appelée SDR2, qui se répartissent en deux sous-groupes étroitement liés, SDR2a (24 nt) et SDR2b (25 nt). Les deux sous-groupes partagent le même noyau palindromique de 20 nt, à l'exception d'une insertion/suppression ( Fig. 1 ). Bien que le schéma des mutations uniques au sein du palindrome soit fortement biaisé en faveur de ceux qui maintiennent l'appariement des bases via l'interaction GU (AC sur le brin complémentaire), les preuves sur la base de mutations compensatoires pour une structure secondaire de SDR2a et SDR2b maintenue par sélection sont faibles (Tableau 2 Figures supplémentaires 2A, 2B). Cependant, les variantes les plus courantes de SDR2 ne diffèrent que par les deux nucléotides centraux (Fig. 9C supplémentaire), ceux qui ne devraient pas participer à l'appariement des bases si le palindrome se repliait sur lui-même. L'élément est parfois flanqué à droite de quatre nucléotides (souvent CTAC) capables d'étendre le palindrome à 28 nt (Figs. 2A, 10).

Tableau 2.

Analyse des mutations dans les régions de structure secondaire putative

a Une séquence de chaque sous-famille a été considérée, à l'exclusion des séquences avec insertions ou délétions. En particulier, les éléments avec des insertions connues d'éléments SDR (par exemple, SDR1.3) ont été exclus. Dans le cas de SDR1, seules les instances détectées en fonction du nombre de discordances ont été prises en compte.

b Toutes les paires de positions dans l'ensemble de séquences alignées ont été prises en compte, chaque fois qu'un nucléotide de la paire était un G et l'autre un C ou l'un était un A et l'autre un T. Les doubles mutations étaient définies comme celles dans lesquelles les deux nucléotides de une paire à l'étude différait des nucléotides aux mêmes positions dans la séquence canonique pour la famille SDR. Les mutations simples ont été définies comme celles dans lesquelles un seul des deux nucléotides différait de la séquence canonique.

c Les paires de nucléotides étaient considérées comme structurelles si elles correspondaient à une paire identifiée sur la figure 1 comme participant possiblement à l'appariement des bases. Sinon, la paire a été considérée comme non structurelle.

d Les doubles mutations étaient considérées comme compensatoires si la paire résultante était constituée d'un G et d'un C ou d'un A et d'un T. Les paires présentant des mutations simples étaient comptées comme conduisant à une paire GT, une paire AC ou toutes les autres paires. Le nombre réel est le nombre d'instances du type de mutation considéré qui ont été observées dans des paires structurelles. Le nombre attendu est le nombre calculé pour les paires structurelles en utilisant les fréquences de classe de mutation dans les paires non structurelles. Un test χ 2 a été utilisé pour évaluer la signification. Un et deux astérisques indiquent l'importance de la P < 0,05 et P < 0,01 niveaux, respectivement. Les différences significatives sont toutes les augmentations (indiquées en gras), sauf indication contraire.

Caractérisation du SDR3

L'interruption dans l'intron de Nostoc Nos51 a été utilisé pour trouver dans N. punctiforme une petite famille de séquences, SDR3 (Fig. 1 Supplemental Fig. 3). La variabilité de l'ensemble est insuffisante pour permettre l'identification des régions complémentaires conservées.

Caractérisation du SDR4

Pas de séquence dans le N. punctiforme génome correspondait à l'étendue complète de l'interruption de 45 nt à partir de Nostoc Nos33. Un segment interne de 25 nt, cependant, était similaire à la plus grande famille de petits éléments répétés que nous ayons trouvé, SDR4 (Fig. 1 Fig. 4 supplémentaire). L'élément a deux paires de segments complémentaires, tous deux confirmés par de multiples mutations compensatoires qui préservent l'appariement des bases (tableau 2, figure supplémentaire 4). Notez, cependant, que le choix du brin montré sur la figure 1 est quelque peu arbitraire. Nous ne pouvons pas exclure la possibilité que le brin complémentaire soit fonctionnellement important. La partie restante de la séquence de Nostoc Nos33 est identique à SDR1.21 (Fig. 1 supplémentaire). La séquence originale de 45 nt est donc une fusion de deux éléments SDR, une question qui sera explorée plus en détail ci-dessous.

Caractérisation de SDR5 à SDR8

En caractérisant ces familles d'éléments répétés liés à des interpolations connues au sein des introns cyanobactériens, nous avons rencontré d'autres éléments répétés juxtaposés (Fig. 1 Fig. 1 Supplémentaires. 5𠄸), que nous avons appelés SDR5 à SDR8. SDR5, comme SDR4, possède des régions confirmées par des mutations compensatoires (tableau 2, figure 5 supplémentaire) qui peuvent déterminer les structures secondaires des éléments. SDR6 a des régions similaires, bien qu'il y ait une variabilité insuffisante pour tester la signification de l'appariement de bases potentiel. Ces trois familles de séquences répétées partagent peu de séquences communes, mais leurs structures secondaires prédites dans chaque cas deux boucles GyA fixées en place par des tiges riches en GC montrent une similitude frappante (Fig. 2A𠄼). SDR8 peut également posséder une boucle GyA flanquée d'une tige riche en GC.

Structures secondaires proposées des éléments SDR. Les boucles d'éléments sont données sous forme de logos de séquence, où la hauteur des lettres empilées à une position donnée est proportionnelle au contenu de l'information à cette position et la fréquence relative de chaque nucléotide est donnée par la hauteur relative de la lettre. Les nucléotides de consensus sont représentés par des lettres ou des cercles pleins (A, vert C, bleu G, jaune T, rouge). Les séquences cibles proposées sont séparées des éléments SDR par des barres épaisses. (A𠄼) Éléments SDR complets SDR4, SDR5 et SDR6 () variante boucle gauche de SDR4 (E, F) variante boucle droite de SDR4. Les flèches identifient une extension de la tige droite.

SDR4.12 (Fig. 1) est plus grand de 3 nt que les séquences SDR conventionnelles en raison d'une boucle droite qui ne correspond pas au modèle habituel. Ceci et d'autres découvertes fortuites nous ont incités à rechercher systématiquement des instances de SDR4 qui avaient jusqu'à trois nucléotides supplémentaires dans la bonne boucle. Un total de 33 cas de ce type ont été trouvés (Fig. 2E, F Fig. 4 supplémentaire). Dans tous les cas où un nucléotide supplémentaire a été trouvé, la boucle possédait une pyrimidine centrale supplémentaire. Dans tous les cas où trois nucléotides supplémentaires ont été trouvés, les nucléotides extrêmes s'apparient et les quatre internes suivent le même schéma, GTTA, qu'avec un nucléotide supplémentaire. La boucle gauche dépasse rarement 3 nt dans les instances de SDR4 dans N. punctiforme. Cependant, de telles extensions sont beaucoup plus courantes dans les séquences SDR4 d'autres cyanobactéries apparentées, avec leurs séquences similaires à celles des boucles droites (Fig. 2D). Nous n'avons pu trouver aucune instance de SDR5 avec des extensions de boucle.

SDR7, comme SDR2a, contient une longue séquence palindrome parfaite, dont l'auto-appariement n'est pas significativement étayé par une analyse des mutations au sein du palindrome (tableau 2, figure supplémentaire 7).

Structure secondaire possible dans les éléments SDR

Toutes les familles SDR possèdent des régions palindromes capables d'appariement de bases internes, mais les palindromes d'ADN sont également couramment utilisés comme sites de liaison par les protéines dimères. Pour évaluer si ces régions jouent un rôle dans la structure secondaire, nous avons analysé les occurrences de mutations compensatoires, indicateurs importants des interactions nucléotidiques et nucléotidiques (Rousset et al. 1991 Rivas et Eddy 2001). Le nombre de mutations compensatoires dans les paires de nucléotides supposées être importantes en structure (indiqué sur la figure 1) a été comparé au nombre de tous les autres appariements possibles (tableau 2). Dans les cas de SDR1, SDR4 et SDR5, le nombre de mutations compensatoires aux positions structurelles dépassait significativement celui attendu des appariements arbitraires, et dans le cas de SDR2a, l'excès était faiblement significatif.

L'appariement de bases entre G et T (ou U dans l'ARN) peut également servir à préserver la structure secondaire ou peut être un état intermédiaire sur la voie de mutations compensatoires complètes (Rousset et al. 1991). Un changement produisant une combinaison AC est cohérent avec l'appariement GT de nucléotides sur le brin opposé. Fait intéressant, le nombre de mutations uniques permettant l'appariement GT dans des positions structurelles a largement dépassé les attentes dans les cas de SDR1 et SDR5, tandis que le nombre d'appariements de GT dans des positions structurelles sur les deux brins a largement dépassé les attentes dans le cas de l'élément symétrique SDR2a. Curieusement, l'élément asymétrique SDR4 avait également augmenté de manière significative la possibilité d'appariements GT sur les deux brins aux positions structurelles.

Recherche exhaustive d'éléments SDR dans le génome de Nostoc

Nous craignions qu'en suivant les interpolations dans le Nostoc introns, nous avons peut-être ignoré les séquences répétées d'une plus grande importance quantitative. Pour résoudre ce problème, nous avons effectué une recherche exhaustive et impartiale d'éléments d'au moins 24 nt qui se produisent en plusieurs copies dans le génome de N. punctiforme, et à titre de comparaison, a appliqué la même analyse aux génomes de deux autres bactéries : une cyanobactérie lointainement apparentée, Synéchocyste PCC 6803, et Escherichia coli ( Tableau 3 ).

Tableau 3.

Les plus nombreuses séquences de 24 nt dans N. punctiforme

a Les éléments SDR décrits dans cet ouvrage sont indiqués en gras.

b La longueur donnée pour les éléments SDR est la longueur de l'élément plus sa séquence cible proposée.

c Les coordonnées sont chromosomiques sauf indication contraire.

En tête de liste des séquences répétées dans N. punctiforme sont deux 24-mères contenus dans plusieurs familles CRISPR précédemment décrites (Godde et Bickerton 2006) dans le Nostoc génome. Les répétitions et séquences d'insertion heptamériques et octomériques en tandem (taille normale et miniature) sont également sur la liste, mais la majorité des séquences répétées courantes dans Nostoc font partie des éléments SDR caractérisés dans la section précédente. La seule exception fait partie d'un long palindrome imparfait de longueur variable, appelé SDRQ, qui rappelle les séquences BoxC de E. coli (Bachellier et al. 1999), en ce que le palindrome provient d'une région riche en purines juxtaposée à une région riche en pyrimidine. Il existe au moins 14 copies de cet élément 𾄀 nt et plusieurs dizaines d'autres instances qui sont plus petites ou trop divergentes pour être détectées par BLAST dans leur intégralité. Une caractérisation plus complète de cet élément (et d'autres de moindre envergure) sort du cadre de ce rapport.

Synéchocyste PCC 6803 et E. coli ont des modèles assez différents de séquences répétées (tableau 3). L'ensemble des séquences répétées de Synéchocyste est dominée par les séquences d'insertion, tandis que presque toutes les séquences répétées dans E. coli avec le numéro de copie 㸐 appartiennent à une seule famille décrite précédemment, PU/REP (Bachellier et al. 1999). Les membres de cette famille ne diffèrent les uns des autres que par quelques nucléotides, et comme plusieurs des éléments SDR, les éléments PU/REP ont des séquences qui assument une structure secondaire, comme le confirment les mutations compensatoires (Fig. 11 supplémentaire).

Étant donné que SDR2a et SDR7 contiennent de longs palindromes parfaits, nous avons également recherché dans le génome toutes les séquences palindromes parfaites de longueur égale ou supérieure à 2 × 10 nt (Fig. 10). Sur les 124 palindromes trouvés, 55 sont représentés par des séquences SDR2a et SDR7, et aucun des autres ne se produit avec un nombre de copies supérieur à 2.

Les séquences SDR de la figure 1 sont donc les plus nombreuses de toutes les répétitions et palindromes non caractérisés dans le génome de N. punctiforme, mais ce type de répétition n'est généralement pas retrouvé dans les génomes bactériens. Le nombre total de répétitions indiqué sur la figure 1 représente environ 0,3 % du génome total de N. punctiforme et environ 1,5% de sa séquence intergénique.

Emplacements des éléments SDR

Il serait intéressant de savoir à quelle vitesse au cours de l'évolution de nouvelles insertions se produisent dans le génome. Un marqueur temporel utile est le taux de transit typique pour les plasmides. Si l'insertion se produit rapidement par rapport au taux de gain et de perte de plasmide, alors on s'attendrait à trouver des éléments SDR apparaissant dans le chromosome et dans les plasmides à un degré proportionnel à leurs tailles cibles. Le rapport entre la taille de la cible chromosomique et la taille de la cible plasmidique peut être estimé comme le rapport de leurs longueurs, qui est de 10:1 dans le cas de N. punctiforme. Il s'agit probablement d'une surestimation, car les plasmides semblent avoir un pourcentage plus élevé de gènes non soumis à la sélection au sein de Nostoc. Les insertions de SDR5 sont réparties entre les chromosomes et les plasmides, avec 5% dans ces derniers (neuf sur 166 Fig. 1 ). Dans les cyanobactéries apparentées Anabaena PCC 7120 et Anabaena variabilis, six des 16 insertions de SDR5 sont dans des plasmides, cinq d'entre elles dans un seul plasmide, pAlpha. Les séquences des familles SDR restantes, cependant, sont majoritairement dans le chromosome, 1001 instances contre 17 dans les instances de plasmides (un rapport de 60:1). Si les éléments SDR peuvent se déplacer entre des molécules distinctes, ils se déplacent considérablement plus lentement que le taux de perte et d'acquisition de plasmides, à l'exception de SDR5.

Comme on pouvait s'y attendre, il existe un fort biais contre l'insertion d'éléments SDR dans les gènes (tableau 4). Ce biais est le plus prononcé lorsque la longueur de l'élément n'est pas un multiple de trois ( Tableau 4 , cf. la fraction d'insertions SDR1, SDR2a, SDR3, SDR4 et SDR5 dans les gènes avec la même fraction d'insertions SDR2b et SDR7).

Tableau 4.

Contexte des éléments répétés dans le génome de N. punctiforme et E. coli

a La longueur est donnée comme le nombre de nucléotides insérés dans une cible de séquence connue (soit un gène conservé, soit une séquence répétée). Dans le cas de SDR3, 25 nt sont apparemment insérés avec la perte de 1 nt de la cible. La longueur de SDR7 peut varier. La séquence de 24 nt donnée pour SDR8 peut faire partie d'un élément plus large, comme indiqué dans le texte. Le nombre suivant le signe plus (lorsqu'il est présent) indique la longueur de la cible préférée. Un point d'interrogation indique que la valeur est basée sur des preuves limitées.

b Nombre total d'instances (tel que défini dans Méthodes) et nombre total où le nombre de copies de séquences identiques est d'au moins 3, tel que tiré des tableaux supplémentaires 1𠄸.

c Contexte des insertions : au moins en partie au sein d'un gène ou intergénique. Si intergénique, alors entre gènes en orientation parallèle (P), convergente (C) ou divergente (D). Le premier pourcentage est relatif à toutes les insertions de l'élément donné, et le second est relatif à ces insertions dans les régions intergéniques. Un et deux astérisques indiquent la signification telle que déterminée par un test χ 2 au P < 0,01 ou P < 0,001 niveau, respectivement. La flèche indique la direction de l'écart par rapport aux attentes.

d Seuls les éléments PU contenant un nombre élevé de 24-mères (tableau 4, tableau supplémentaire 10) trouvés par la recherche décrite dans le texte sont pris en compte ici.

L'emplacement des éléments palindromiques SDR2a, SDR2b et SDR7 semble être biaisé vers des séquences en aval de deux gènes (tableau 4). Une partie du biais peut être un artefact du plus grand pourcentage d'espace au sein des gènes convergents qui n'est pas soumis à une forte pression sélective, mais si tel est le cas, le biais est alors beaucoup moins important avec les éléments SDR non palindromiques. Un tel biais est observé avec les séquences palindromiques d'une grande variété d'eubactéries (Petrillo et al. 2006), et en particulier, avec les éléments PU/REP de E. coli (Tableau 4). Les éléments SDR2a vont encore plus loin, tendant à se situer près des extrémités des gènes. Un total de 31% se trouvent à moins de 30 nt de l'extrémité 3′ d'un gène, deux à trois fois la valeur typique des éléments SDR. Cette caractéristique est expliquée par un sous-ensemble d'éléments SDR2a, ceux flanqués de répétitions heptamériques, comme décrit dans la section suivante.

Les séquences de terminaison transcriptionnelles Rho-indépendantes consistent généralement en un long palindrome en aval d'un gène, suivi d'une chaîne de résidus thymidine (Yarnell et Roberts 1999). De longues régions riches en thymidine (telles que définies précédemment par de Hoon et al. 2005) sont rarement observées adjacentes aux éléments palindromiques SDR (Figs.2A, 2B, 7) ou des éléments PU/REP (Fig. 11 supplémentaire), mais de courts étirements (au moins quatre thymidines) sont communs aux séquences 3′ à SDR7, trouvées dans les 10 nt de 39% des séquences SDR7, par rapport à 3% attendus des fréquences des mononucléotides. Curieusement, dans 82 % de ces cas, les thymidines sont immédiatement précédées d'un des trois codons de terminaison, même si le codon ne fait pas partie d'un cadre de lecture ouvert.

Séquences flanquant des éléments SDR

Les éléments SDR tels que définis constituent-ils des unités mobiles ? Si un élément était dispersé en tant qu'unité indépendante, alors on ne s'attendrait pas à voir de corrélation entre les variations dans les séquences flanquantes et les variations mineures au sein de la séquence intermédiaire elle-même (sauf tel que déterminé par les préférences de la cible). En revanche, si la séquence intervenante était dispersée dans le génome par un mécanisme qui dépendait des séquences flanquantes, alors le regroupement des éléments SDR par leur variation interne devrait regrouper simultanément les segments par leurs séquences flanquantes.

Dans certains cas, il existe une forte corrélation entre une famille SDR et une séquence répétitive flanquante spécifique. Un total de 68% de ces instances de SDR2a qui se produisent en copie élevée (trois copies ou plus) sont flanquées d'une variation reconnaissable de STRR8 (Meeks et al. 2001), la répétition heptamère [AACTCCT]m (34 cas sur 50) (Fig. 1 Fig. 2A supplémentaire). Au total, 92 % de ces instances de SDR3 à copie élevée sont flanquées d'une variante de [AGTGC TG]m (12 cas sur 13). Dans d'autres cas, une répétition heptamère flanquante est associée à une sous-famille et une répétition différente à une sous-famille différente, par exemple, dans les cas de SDR1.2 et SDR1.3 associés à STRR1 (Mazel et al. 1990 Meeks et al. 2001 ), [TGGGGAA]m, (11 cas sur 15) et SDR1.15 associé à [GAGCAGG]m (10 cas sur 10).

Certains éléments SDR sont intégrés dans des entités plus grandes qui portent la marque des éléments transposables ( Fig. 3 ). SDR2b se trouve souvent dans une séquence relativement conservée plus grande, typiquement de 101 nucléotides de long, mais jusqu'à 134 nucléotides (Fig. 2B supplémentaire). Les unités les plus grandes contiennent une deuxième copie inversée de SDR2b. Les unités sont liées par des répétitions inversées constantes de 18 nt et flanquées d'une répétition directe de 10 nt dont la séquence varie d'une instance à l'autre. Au moins une extrémité reconnaissable se trouve à côté de 72 des 84 instances de SDR2b. Étant donné que les répétitions inversées flanquées de répétitions directes sont une signature commune des transposons, nous avons examiné le génome pour d'autres instances des séquences répétées inversées. Nous avons trouvé quatre fois plus d'unités avec ces extrémités inversées à côté de celles contenant SDR2b. Un total de 90 % d'entre elles étaient inférieures à 160 nt, mais deux étaient des séquences d'insertion de taille normale contenant une copie de la transposase codée par npr1652. De plus, il y a 14 instances complètes de SDR8 et 14 instances complètes de SDR4 dans npr1652-les minitransposons liés (Fig. 3A, Fig. 8). De toute évidence, un minitransposon apparenté à celui contenant npr1652 abrite de nombreux éléments SDR. Le minitransposon a été récemment rapporté dans Nostoc et d'autres bactéries (Zhou et al. 2008).

Minitransposons transportant des éléments SDR. Des exemples représentatifs de quatre familles (A&# x02013D) de minitransposons sont présentés. Lorsqu'un transposon complet parent a été identifié, sa séquence est en rouge ainsi que des séquences identiques dans les minitransposons dérivés. Lorsqu'un transposon complet parent n'a pas été identifié, seules les répétitions inversées des minitransposons proposés sont indiquées en rouge. Les répétitions inversées sont indiquées par des flèches rouges (en trait plein pour les minitransposons, en pointillés pour les transposons complets). Les répétitions directes flanquantes, lorsqu'elles sont présentes, sont indiquées par des flèches noires et sont représentées en noir, soulignées. Les éléments SDR sont mis en évidence selon les conventions de la figure 1. Les traits de soulignement dans les transposons complets indiquent des cadres de lecture ouverts. Les coordonnées d'ordre inférieur de chaque exemple, toutes issues du chromosome de N. punctiforme sauf indication contraire, sont : (A1) 263683, (A2) 670380B, (A3) 3371581B, (A4) 2032965B, (B1) 697575B, (B2) 1598337B, (C1) 2898180B, (C2) 75121B dans Nodulaire CCY9414 Contig 003, (D1) 7174915B, (D2) 6179713F dans le chromosome de Anabaena variabilis, (D3) 5233271F dans le chromosome de Anabaena PCC 7120, et (D4) 114174B dans le plasmide pAvaC de A. variabilis. La lettre après la coordonnée indique que la séquence montrée se trouve sur le brin avant (F) ou arrière (B).

SDR4, et en particulier SDR8, sont des habitants communs d'autres minitransposons. Onze instances complètes de SDR8 et six instances complètes de SDR4 (toutes adjacentes à SDR8) se trouvent dans un minitransposon pour lequel un transposon complet n'est pas connu, et cinq autres instances de SDR8 se trouvent dans un troisième minitransposon apparent (Fig. 3B Fig. 8). Ces deux minitransposons contiennent également SDR8 au sein d'une autre cyanobactérie hétérokystique, Nodulaire CCY9414. Étonnamment, toutes les instances de SDR8 et certaines de SDR4 dans les minitransposons sont intégrées dans la même séquence de 33 nt. Cette séquence se produit huit fois sans interruption dans le Nostoc génome : trois fois dans le npr1652-liés au minitransposon et cinq fois ailleurs dans le chromosome. Dans tous les cas, il est flanqué à l'extrémité 3′ d'une région riche en purines, tout comme dans les trois minitransposons. En théorie, cette région a joué un rôle dans les événements conduisant à l'insertion des éléments SDR dans les minitransposons. De nombreux cas du minitransposon illustré à la figure 3B se trouvent dans les deux Anabaena génomes, mais ni la séquence conservée de 33 nt ni SDR8 ne s'y trouvent (données non présentées).

Seules quatre instances de SDR2a dans N. punctiforme se trouvent dans le minitransposon complet illustré à la figure 3C, mais les cyanobactéries apparentées ont beaucoup plus de copies (comme décrit plus loin), y compris une copie d'un transposon apparemment complet. Cinq instances de SDR5.3 se trouvent dans des transposons de pleine longueur (données de la figure 1 non présentées).

Les séquences entourant les éléments SDR2a sont fortement associées à leurs caractéristiques positionnelles. Le biais des éléments SDR2a pour les positions immédiatement en aval des gènes décrits dans la section précédente est entièrement expliqué par le sous-ensemble entouré de répétitions heptamériques. Dans cette sous-classe, 57% des éléments SDR2a se trouvent à moins de 30 nt de l'extrémité 3′ d'un gène, et le plus remarquable, dans tous les 40 cas sauf un, le gène est situé à droite, selon l'orientation indiquée dans la figure 1 et la figure 6C (ci-dessous) (voir la figure supplémentaire 2A pour les instances multicopies).

Comparaisons de séquences parmi les cyanobactéries. Des séquences de gènes orthologues ou des régions adjacentes aux gènes orthologues sont montrées où au moins une des séquences porte un élément SDR. Les conventions de couleur sont telles que décrites sur la figure 1. De plus, les séquences de gènes sont représentées en italique et en cyan foncé (en avant) ou en magenta (en arrière), et l'étendue du cadre de lecture est indiquée par des flèches. Les séquences sont tirées de N. punctiforme (gènes npr0867, npf3461, npr5797, pnpbr028, et pnpaf278), Anabaena PCC 7120 (gènes alr0534, all1327, alr1612, all2013, alr2719, et alr3810), Anabaena variabilis (gènes ava0005, ava2936, et ava3794), et Nodulaire CCY9414 (gènes n9414?03688, n9414?12753, et n9414?13260). Les astérisques indiquent les positions de conservation parmi toutes les séquences données.

Il est important de noter que les éléments SDR sont généralement distincts des unités dans lesquelles ils sont contenus. Par exemple, SDR4 se trouve plus souvent en dehors des minitransposons décrits ci-dessus, et les minitransposons se trouvent généralement sans éléments SDR. Les répétitions heptamériques se trouvent dans le Nostoc génome beaucoup plus fréquemment sans éléments SDR.

Les séquences flanquantes pour certains éléments SDR sont très variables (figures supplémentaires 1𠄸). À l'exception de SDR5.3 transmis par transposon, les éléments SDR5 ne partagent généralement pas de séquences flanquantes, et il en va de même avec SDR7. À l'autre extrême se trouvent les éléments SDR3 et SDR8, qui sont presque tous flanqués des mêmes répétitions en tandem (SDR3) ou d'une séquence conservée plus grande (SDR8). SDR4 se situe entre ces deux extrêmes, car les membres des sous-familles au sein de SDR4 partagent des séquences flanquantes, mais il existe une grande variabilité dans les séquences flanquantes des différentes sous-familles et souvent au sein des sous-familles.

SDR1.17 (Fig. 1) est l'une des nombreuses sous-familles dont les membres ont des séquences flanquantes presque identiques qui ne peuvent pas être expliquées en faisant appel à des répétitions heptamériques ou à des éléments transposables. Ceux-ci sont discutés dans la section suivante.

Éléments SDR imbriqués

Tous les éléments SDR caractérisés dans cette étude sont inférieurs à 30 nt, mais la séquence interpolée dans les introns leu d'ARNt de Nostoc Nos41 et Nos33 mesurent respectivement 48 et 45 nt (Fig. 1, sous SDR1 et SDR4). Les deux, cependant, peuvent être considérés comme un élément SDR inséré dans un autre : un élément SDR1 sans nom inséré dans une instance de SDR1.21 dans le premier cas et SDR4.4 dans SDR1.21 dans le second cas. Un examen attentif des séquences flanquantes des éléments SDR révèle que de tels éléments SDR imbriqués sont extrêmement courants dans N. punctiforme.

La figure 4A montre un SDR imbriqué typique et comment il aurait pu survenir par des insertions successives de SDR4 dans lui-même, ciblant la séquence CGAAG. La figure 4B montre un exemple plus extrême, avec six insertions différentes de SDR1 dans un élément minitransposable putatif et fournit une séquence plausible d'événements qui auraient pu donner lieu aux 11 dérivés de minitransposons apparemment apparentés qui sont observés dans le génome actuel de N. punctiforme. Ces séquences illustrent non seulement la capacité de SDR1 à s'insérer dans de nouveaux emplacements, mais également la capacité des forces de dégradation et de mutation à récupérer l'espace génomique occupé par des séquences répétées. Il semble juste de conclure qu'à l'exception des cas où les séquences répétées offrent un avantage sélectif, nous ne voyons que les cas qui sont apparus relativement récemment au cours de l'évolution.

Éléments SDR imbriqués. (UNE) Une structure imbriquée composée de plusieurs éléments SDR4 utilisant les conventions de couleur décrites dans la figure 1 . L'élément emboîté (ligne 4), situé dans le chromosome de N. punctiforme de 671 496 à 671 583 (inversé), peut avoir surgi, comme indiqué, par l'insertion de SDR4.5 (lignes 1 et 2), suivie de l'insertion d'un élément SDR4 sans nom dans l'orientation opposée (lignes 2 et 3), et enfin par l'insertion de SDR4.3 (lignes 3 et 4). La séquence de l'intermédiaire proposé illustré à la ligne 3 existe en réalité ailleurs dans le chromosome, entre les coordonnées 3 226 461 et 3 226 527 (inversé). Les intermédiaires 1 et 2 proposés sont hypothétiques. (B) Structures imbriquées dérivées de plusieurs insertions apparentes d'éléments SDR1, surlignées en jaune. Les éléments SDR1 orientés vers l'avant sont indiqués en caractères noirs ou verts. Ceux dans l'orientation inverse sont indiqués en caractères rouges. Les séquences en caractères rouges flanquant les éléments imbriqués sont les répétitions terminales inversées d'un minitransposon putatif dans lequel les éléments imbriqués sont intégrés. Les séquences surlignées en gris sont conservées mais autrement non caractérisées. Les coordonnées d'ordre inférieur des séquences présentées sont (B1) 3368609F, (B2) 2564863B, (B3) 1746187F, (B4) 8086669B, (B5) 633195F, (B6) 50757F, (B7) 8020729F, (B8) 6448446F, (B9) 1811789b, (B10) 7091736B et (B11) 2217329F, où F et B indiquent respectivement le brin avant et arrière (inverse). Les encart à Haut présente une série d'événements plausibles qui auraient pu donner lieu aux séquences observées. Les nombres dans les cercles font référence aux lignes de l'alignement. Les cercles gris sont des intermédiaires hypothétiques. (C) Éléments composés apparemment apparentés composés de SDR1, SDR4 et SDR6. Les séquences sont organisées d'abord par les éléments les plus externes, deux sous-familles sans nom de SDR1. Chaque regroupement est ensuite divisé selon que SDR4.11 ou SDR4.12 s'est inséré dans l'élément SDR1. Les coordonnées d'ordre inférieur des séquences présentées sont (D1) 3134527B, (D2) 2144806F, (D3) 4962007F, (D4) 3363464F, (D5) 5179224F, (D6) 8021963F, (D7) 6220474F, (D8) 733274B, (D9) 187174B, (D10) 676346B, (D11) 5070575B, (D12) 7201684F, (D13) 6371472B, (D14) 5596457F et (D15) 3424319B.

Tous les éléments imbriqués ne peuvent pas être expliqués par une série ramifiée d'insertions et de mutations. La figure 4C montre un ensemble de séquences apparentées qui ne peuvent pas être ainsi expliquées, sans recourir à des coïncidences improbables, par exemple, l'insertion du même SDR4/6 à la même position dans deux instances différentes de SDR1. Les séquences indiquent un mécanisme de propagation d'une mutation d'un site à d'autres séquences similaires, peut-être par recombinaison parmi des copies chromosomiques ou par conversion génique.

Compte tenu de la complexité des éléments imbriqués illustrés par la figure 4, il est clairement difficile d'automatiser leur identification. Par conséquent, nous ne savons pas dans quelle mesure les éléments imbriqués apparaissent dans le génome. Pour avoir une idée, nous avons effectué une recherche exhaustive des éléments SDR1 identifiés par le motif “. . ..(<<<<)GAGCG.AG.CGA(>>>>)” (où <<<< >e&e� #x0003e indique des répétitions inversées de 4 nt) et divisé par des insertions de 21 à 28 nucléotides. Au total, 72 cas de ce type ont été trouvés dans le N. punctiforme génome (45% du nombre d'instances non fractionnées de SDR1), dont 37% sont interrompues par une insertion de SDR1 et 43% par SDR4. En regardant de l'intérieur, sur les instances de SDR4 dans les sous-familles avec trois copies ou plus, 54% se trouvent dans SDR1 ou SDR4. Dans les cas de SDR1, 27% se trouvent dans SDR1. La figure 1 indique une partie de la diversité de ces éléments imbriqués (les figures supplémentaires 1 et 4 montrent tous les cas avec des sous-familles à copie élevée).

En revanche, SDR6 fait partie de ce qui semble être un seul élément fusionné avec SDR4. Au total, 87 % de toutes les instances de SDR6 sont précédées de SDR4 (ou de son résidu) dans la même position et la même orientation inversée, et il en va de même pour les instances de cyanobactéries apparentées (Fig. 6 supplémentaire), suggérant une origine unique . Il n'y a aucune preuve claire d'une existence indépendante de SDR6. L'unité SDR4/SDR6 se situe dans plusieurs contextes différents, cohérents avec l'idée que l'unité fusionnée est mobile. Une insertion s'est évidemment produite dans le SDR1.2 pour former le SDR1.3 initialement anormal, mentionné précédemment.

L'insertion de SDR4 dans SDR1 indique que SDR1 était présent dans le génome à un moment où SDR4 était mobile. Nous avons recherché d'autres relations de ce type et trouvé des insertions de SDR4 dans SDR5 et l'élément SDR4/SDR6 ainsi que dans lui-même (Fig. supplémentaire 4), SDR1 dans SDR5 ainsi qu'en lui-même (Fig. supplémentaire 1), et le SDR4/ élément SDR6 en SDR1 ainsi qu'en lui-même (Figs. 4, 6). Nous n'avons trouvé aucun exemple d'autres éléments SDR participant à l'imbrication. On pourrait en déduire un ordre d'apparition de SDR5, puis SDR1, puis SDR4/SDR6, et enfin SDR4, mais la véritable séquence des événements est sans doute plus complexe, comme nous le verrons.

Éléments SDR dans d'autres cyanobactéries

Afin de relier la présence d'éléments SDR à la phylogénie des organismes, nous avons considéré les génomes des cyanobactéries illustrés à la figure 5. A l'exception de SDR1 et SDR7, les éléments SDR étaient cantonnés à une classe cohérente, les cyanobactéries hétérokystiques, représentées par N. punctiforme, Anabaena PCC 7120, A. variabilis ATCC 29 413, et Nodulaire CCY9414. Quelques cas de SDR7 ont également été trouvés dans des souches d'une classe plus large, les cyanobactéries filamenteuses, dont les cyanobactéries hétérokystiques font partie, et une souche unicellulaire, C. watsonii, apparenté aux cyanobactéries filamenteuses, possède de nombreux éléments SDR1. Les éléments SDR originaux dans l'intron d'ARNt de différentes souches de Nostoc dans cinq des six cas correspondent exactement à la séquence d'un élément SDR de N. punctiforme, et dans quatre de ces cas, les séquences flanquantes correspondent également.

Organismes utilisés dans les comparaisons entre espèces d'éléments SDR. L'arbre phylogénétique au la gauche des noms d'organismes est dérivé d'une comparaison de séquences d'ARNr 16S de cyanobactéries. Les flèches indiquent les nœuds définissant les cyanobactéries hétérokystiques (l'objectif principal de ce travail, mis en évidence dans le tableau) et le clade plus englobant des cyanobactéries filamenteuses. Tous les génomes sauf ceux de Lyngbya et Crocosphaera ont été complètement séquencés. Les séquences ont été extraites du Joint Genome Institute (http://genome.jgi-psf.org/mic_home.html), de CyanoBase/Kazusa (http://bacteria.kazusa.or.jp/cyano/cyanobase/), ou du Centre national d'information sur la biotechnologie (http://www.ncbi.nlm.nih.gov/). Dans ce dernier cas, le numéro d'accession GenBank est indiqué. Le petit plasmide, pANS, de Synéchocoque PCC 7942 a également été extrait de GenBank, accession GI:247785. Les Nostoc punctiforme génome a récemment été déposé dans GenBank (numéro d'accès <"type":"entrez-nucleotide","attrs":<"text":"NC_010628","term_id":"186680550","term_text":"NC_010628" >> NC_010628), avec seulement des différences mineures dans l'annotation par rapport à la version utilisée dans cette étude. L'incidence de chacune des familles SDR (SDR1 à SDR8) est indiquée pour chaque génome, représentée par un plus (au moins 10 occurrences), un tilde (au moins une, mais moins de 10 occurrences), ou rien (0 occurrence). Descriptions publiées des génomes : (UNE) Palenik et al. 2003, (B) Rocap et al. 2003, (C) Dufresne et al. 2003, () Holtman et al. 2005, (E) Nakamura et al. 2003, (F) Nakamura et al. 2002, (g) Kaneko et al. 2001, (H) Meeks et al. 2001, (je) Kaneko et al. 1996, (J) Blattner et al. 1997).

Il est d'un intérêt évident que les insertions apparentes d'éléments SDR soient d'origine ancienne ou récente. Dans le premier cas, alors les sites d'insertion pourraient être conservés parmi les organismes apparentés. Nous avons aligné et examiné les séquences sur tous les sites informatifs pour chaque élément, un site informatif défini comme celui se produisant dans un gène conservé (un gène avec des orthologues dans les deux organismes considérés) ou entre les deux mêmes gènes conservés. Les résultats de cette analyse sont résumés dans le tableau 5 et discutés ci-dessous.

Tableau 5.

Éléments SDR dans les sites conservés

Le nombre en caractères gras est le nombre d'instances où l'élément SDR donné est trouvé dans les deux organismes indiqués à la même position informative, définie soit à l'intérieur d'un gène conservé, soit entre les deux mêmes gènes conservés. Les gènes sont considérés comme conservés s'ils sont des orthologues comme décrit dans les Méthodes. Les premier et deuxième nombres entre parenthèses sont le nombre total d'instances informatives de l'élément SDR donné dans le premier et le deuxième organisme, respectivement.

SDR2a et SDR4 sont les éléments les plus courants parmi les cyanobactéries hétérokystiques, avec des dizaines d'instances dans les quatre génomes séquencés (Fig. 1 Figs. 2A, 4), mais ils sont assez différents dans le degré auquel leurs sites d'insertion sont partagé entre les génomes. Les instances de SDR4 se produisent généralement sur des sites qui ne sont pas liés d'un organisme à l'autre. Sur 108 instances de SDR4 dans N. punctiforme qui sont informatifs, aucun n'est partagé dans Anabaena PCC 7120, et les instances de SDR4 dans chaque organisme ont différents ensembles de séquences flanquantes caractéristiques. Plus révélateur encore, sur 69 occurrences informatives dans Anabaena PCC 7120, seuls trois sont partagés avec la souche étroitement apparentée A. variabilis. La plupart des sites de SDR4 sont manifestement apparus ou disparus plus récemment que la divergence des deux espèces de Anabaena.

En revanche, les instances de SDR2a se produisent souvent aux mêmes sites d'un organisme à l'autre, indiquant une origine plus ancienne que la divergence de l'organisme. Sur 38 occurrences informatives dans Anabaena PCC 7120, 35 sont partagés avec A. variabilis, et quatre d'entre eux sont également partagés avec N. punctiforme (par exemple, voir la figure 6A). Ceux qui sont partagés ont exactement la même séquence SDR2a 48 % du temps, bien plus fréquemment que le hasard ne le laisse supposer. A. variabilis a 150 % plus d'instances de SDR2a que Anabaena PCC 7120. On ne sait pas pourquoi c'est le cas. C'est vrai que seulement A. variabilis a une transposase apparemment active pour le minitransposon lié à SDR2a ( Fig. 3D ), mais plus de la moitié des sites SDR2a trouvés dans A. variabilis mais pas dans Anabaena Les PCC 7120 ne sont évidemment pas associés à un élément ou dérivé transposable. De plus, il n'y a pas de différence évidente entre les éléments SDR2a conservés et non conservés dans A. variabilis en ce qui concerne soit la position (comme décrit dans le tableau 4) soit les séquences flanquantes.

Éléments SDR2a dans les deux Anabaenas sont souvent flanqués d'une répétition heptamère similaire à STRR2 (Mazel et al. 1990 Meeks et al. 2001) (GACAACT). Curieusement, dans les rares cas où une instance de SDR2a est conservée entre Anabaena et Nostoc, les Anabaena élément est flanqué de la séquence STRR2, typique de Anabaena éléments SDR2a, tandis que le Nostoc élément est flanqué de la séquence STRR8, typique de Nostoc Éléments SDR2a (voir figure 6C). Si, comme cela est probable, les éléments SDR2a sur ces sites partagent une origine commune, alors les séquences flanquantes doivent avoir été modifiées d'une manière ou d'une autre pour s'accorder avec les tendances du génome dans son ensemble.

Les instances de SDR1 et SDR4/SDR6 suivent le modèle de SDR4, ne se trouvant pas dans des positions conservées dans les organismes dans lesquels elles se trouvent. Les instances SDR1 sont rarement flanquées des mêmes séquences trouvées à côté des éléments SDR1 de Nostoc. Huit éléments SDR1 de Nodulaire et huit de Crocosphaera sont exceptionnels en ce que leurs séquences flanquantes correspondent aux répétitions heptamériques trouvées flanquant l'élément similaire SDR1.7 de Nostoc. Des instances d'éléments SDR1 imbriqués se trouvent dans les deux Nodulaire et A. variabilis. Ceci est également vrai pour SDR4/SDR6.

SDR3 suit le modèle de SDR2a. Les cinq instances informatives de SDR3 dans Anabaena PCC 7120 sont partagés avec A. variabilis, alors qu'aucun n'est partagé avec Nostoc. Presque toutes les séquences sont flanquées d'au moins un vestige reconnaissable de la même répétition heptamérique qui flanque SDR3 dans Nostoc. Ses insertions semblent antérieures à la divergence des deux Anabaenas. Le tableau 5 semblerait également indiquer une origine ancienne des insertions SDR5. En effet, une insertion se trouve conservée dans les orthologues de NpF5954 parmi les quatre cyanobactéries hétérokystiques (Fig. 12 supplémentaire).

SDR2b est représenté par une seule instance dans les deux souches de Anabaena, à une position conservée entre les deux, mais pas avec Nostoc. Aucun des rares cas de SDR7 et SDR8 chez les cyanobactéries à côté Nostoc étaient dans des positions conservées.

Longueurs unitaires et préférences cibles des éléments SDR

Nous avons comparé des sites conservés contenant des éléments SDR dans un génome mais pas dans un autre, espérant ainsi déterminer leurs limites et en déduire quelles caractéristiques de séquence attirent de nouvelles insertions. Sept de ces insertions de SDR4 ont été trouvées dans des régions conservées, comme défini précédemment (Fig. 6F Fig. 12). Dans cinq de ces cas, l'insertion correspondait à la longueur proposée de l'élément SDR. Les alignements observés sont plus cohérents avec des insertions plutôt que des suppressions, car dans les trois cas où une insertion apparente de SDR4 a été trouvée dans un gène avec des orthologues dans d'autres cyanobactéries, les alignements des orthologues montrent des lacunes où SDR4 devrait apparaître. Dans tous les cas, les séquences flanquant l'insertion de SDR4 étaient cohérentes (au moins trois identités) avec la séquence cible de 5 nt, CG|AAG, déduite de l'analyse des éléments emboîtés (voir ci-dessus).

Sur 12 instances informatives et interprétables d'éléments SDR1 (Fig. 12 supplémentaire), la plupart sont explicables par recombinaison, en utilisant des répétitions heptamériques flanquantes (par exemple, Fig. 6A), mais quatre semblent être des insertions de SDR1 ou une version imbriquée de SDR1 (par exemple , figure 6B). Dans tous ces cas, l'unité d'insertion apparente est de 24 nt (ou multiples de 24 dans le cas d'éléments imbriqués). Aucune séquence cible n'est évidente.

SDR5 montre une préférence encore plus forte pour une séquence cible. Sur 31 insertions de SDR5 dans des régions conservées de gènes avec des orthologues dans deux organismes que nous avons examinés, 29 ont montré des insertions de 21 nt, la longueur proposée de SDR5 (Fig. 6G, Fig. 12). Remarquablement, le site cible apparent de SDR5 est GCG|ATCGC, une séquence (appelée HIP1) qui est fortement surreprésentée dans de nombreuses cyanobactéries (Robinson et al. 1995) et peut-être impliquée dans la recombinaison (Robinson et al. 1997). Comme avec SDR4, les événements conduisant à la présence ou à l'absence de SDR5 doivent être interprétés comme des insertions, et non des délétions, car les orthologues des gènes portant SDR5 chez les cyanobactéries non hétérocystes n'ont pas l'insert. Sur les 67 instances d'éléments SDR5 dans N. punctiforme avec le numéro de copie trois ou plus, 82% se trouvent dans les sites HIP1 entre la troisième et la quatrième position, et tous les éléments restants sont flanqués d'un site de type HIP1 (Fig. 1 Fig. 5 supplémentaire). En dehors d'une préférence quasi absolue pour A et T et les positions 3 et 4, respectivement, des écarts par rapport à la séquence canonique HIP1 sont également probables à toutes les positions (données non présentées). SDR5 a donc une préférence extrême pour les sites HIP1, qui n'est pas moins forte avec des instances chez d'autres cyanobactéries hétérokystiques. Ceci est suffisant pour expliquer l'absence d'insertions SDR5 dans d'autres éléments SDR, comme indiqué ci-dessus, puisque les sites HIP1 n'apparaissent pas dans d'autres éléments SDR.

SDR2a présente une image assez différente. Il y a 64 cas dans lesquels A. variabilis a une copie de SDR2a entre deux gènes conservés, mais Anabaena Le PCC 7120 ne se trouve pas dans la position correspondante (données supplémentaires de la Fig. 12 non représentées). Les alignements de ces régions ont été soigneusement examinés et aucun cas n'a été trouvé montrant une preuve claire d'une nouvelle insertion. Au lieu de cela, 35% des instances sont apparues médiées par la transposition du minitransposon qui contient SDR2a.5 (Fig. 3D Supplemental Fig. 2A). Un total de 49 % semblaient être apparus par recombinaison au niveau de séquences flanquant le plus l'élément SDR à l'aide de variations sur AACAACT répétées en tandem, y compris 10 événements qui semblaient être des duplications de SDR2a à une courte distance de la première instance (Fig. 6D). Parmi les instances restantes, 6% avaient des instances en tandem d'AACAACT flanquant l'élément SDRa mais aucun heptamère discernable dans PCC 7120, et le reste n'a pas pu être interprété, généralement parce que la région intergénique avait divergé au-delà de la reconnaissance. En aucun cas, il n'y a de preuve claire d'insertion, sauf lorsqu'elle est médiée par des processus connus.

Il n'y a que quelques instances de SDR3 dans Nostoc gènes dans des régions suffisamment conservées pour permettre la comparaison avec des gènes orthologues dans Anabaena ou vice versa (Fig. 6E Fig. 12 supplémentaire). Tous les cas interprétables où SDR3 était présent dans un génome mais pas dans l'autre pouvaient être expliqués par la recombinaison entre les régions de répétitions en tandem. Nous n'avons trouvé aucun cas de SDR2b, SDR6, SDR7 ou SDR8 dans des régions suffisamment conservées pour permettre la comparaison du site entre les génomes.


Remerciements

Nous remercions K. Rajashankar et S. Banerjee de la ligne de lumière de la Northeastern Collaborative Access Team pour leur aide lors de la collecte de données et G. L. Conn et M. A. Schureck pour les discussions utiles tout au long du projet et la lecture critique du manuscrit. Ce travail est basé sur des recherches menées à la source avancée de photons sur les lignes de lumière de l'équipe d'accès collaboratif du nord-est, la subvention RR-15301 des National Institutes of Health du NCRR et sur la ligne de lumière SER-CAT. L'utilisation de la source avancée de photons, une installation utilisateur de l'Office of Science exploitée pour le ministère de l'Énergie des États-Unis par l'Argonne National Laboratory, a été financée par le ministère de l'Énergie des États-Unis dans le cadre du contrat DE-AC02-06CH11357.

* Ce travail a été soutenu par le National Science Foundation CAREER Award MCB 0953714 (à C. M. D.).

Cet article contient le tableau S1 et des références supplémentaires.


Possibilités d'accès

Obtenez un accès complet au journal pendant 1 an

Tous les prix sont des prix NET.
La TVA sera ajoutée plus tard dans la caisse.
Le calcul des taxes sera finalisé lors du paiement.

Obtenez un accès limité ou complet aux articles sur ReadCube.

Tous les prix sont des prix NET.


Z-DNA la nouvelle biologie : La troisième dimension de la thérapeutique anticancéreuse

La structure unique de la double hélice d'ADN est l'une des images les plus reconnaissables en biologie. La plupart de l'ADN dans nos cellules prend la forme d'ADN-B. L'ADN B familier est également connu sous le nom d'ADN droitier car les brins d'ADN s'enroulent vers la droite. La structure en double hélice de l'ADN-B a été découverte par Watson et Crick en 1953. Un autre type d'ADN est cependant moins connu : l'ADN-Z pour gaucher. L'ADN-Z a été découvert par hasard et, jusqu'à récemment, son rôle – ou même s'il avait un quelconque but – restait un mystère. L'ADN-Z n'est pas une image miroir de l'ADN-B, mais a sa propre forme unique, une caractéristique que la nature utilise.

Percer le mystère de l'ADN-Z
Une étape importante vers le déchiffrement du rôle de cette forme inhabituelle d'ADN est venue d'une enzyme d'édition d'ARN appelée ADAR. Les enzymes sont des protéines vitales qui accélèrent les réactions chimiques dans la cellule à travers une partie de leur structure appelée domaine catalytique. Sans enzymes, une seule réaction prendrait des heures.

Lorsqu'une cellule fabrique des protéines, l'ARN (acide ribonucléique) est fabriqué à partir d'un gène – un morceau d'ADN. L'ARN porte le code de la protéine particulière qui doit être fabriquée. Fondamentalement, l'enzyme ADAR a la capacité de recoder les messages d'ARN produits par les gènes avant que les informations d'ARN ne soient traduites en séquence protéique. Le recodage effectué par ADAR est connu sous le nom d'édition d'ARN. Dans ce processus, ADAR change l'un des éléments constitutifs de l'ARN en quelque chose d'autre, ce qui signifie que l'ARN porte désormais des informations différentes. L'ARN altéré dirige alors la production d'une protéine qui fonctionne différemment de la version non éditée. L'édition d'ARN permet ainsi à un seul gène de produire un certain nombre de protéines différentes, chacune avec des propriétés uniques.

HandMadeFont.com/Shutterstock.com

ADAR et le cancer
De manière significative, les cellules cancéreuses peuvent utiliser l'ADAR et l'édition d'ARN pour fabriquer des protéines qui leur confèrent un avantage de survie. D'autres fois, les cellules cancéreuses peuvent utiliser l'ADAR et l'édition d'ARN pour éviter d'être terminées, en particulier lorsqu'elles produisent des quantités excessives d'ARN à partir de gènes. Capteurs intégrés dans le signal de la cellule lorsqu'un tel problème se produit. L'alarme déclenchée entraîne une contre-réponse rapide qui peut entraîner la mort d'une cellule cancéreuse, soit parce qu'elle ferme la machinerie de croissance cellulaire, soit parce qu'elle stimule le système immunitaire pour tuer la cellule. La réponse immunitaire générée par les cellules cancéreuses anormales est similaire à celle produite par les virus, qui produisent également de grandes quantités de leur ARN afin de se répliquer.

Pour échapper à la mort, les cellules cancéreuses doivent trouver un moyen d'empêcher l'excès d'ARN qu'elles créent de déclencher une réponse immunitaire. Les cellules cancéreuses le font en recrutant ADAR à leurs propres fins. La capacité d'édition d'ARN d'ADAR supprime une grande partie de l'ARN qui alerte les capteurs d'alarme de la cellule. En effet, de nombreuses cellules tumorales ne peuvent survivre qu'en surproduisant elles-mêmes de l'ADAR. Si ADAR ne peut plus fonctionner, ils meurent, leur dysfonctionnement les rattrape.

Les flipons changent la façon dont les messages d'ARN sont fabriqués, les codons changent la façon dont les protéines sont fabriquées.

Souvent, l'excès d'ARN dans les cellules tumorales provient de parties du génome qui ne produisent normalement pas d'ARN. Beaucoup de ces brins d'ARN ne codent pas pour une protéine et proviennent fréquemment de régions d'ADN où certaines séquences sont répétées plusieurs fois. Une classe commune de ces séquences répétitives est connue sous le nom de répétitions ALU. Au total, les répétitions ALU représentent environ 11% du génome humain. Ils subissent une importante édition par ADAR.

Normalement, l'ARN est simple brin. Cependant, lorsque deux répétitions ALU sont proches l'une de l'autre, mais dans des orientations opposées, elles forment naturellement des ARN double brin. Lorsque cela se produit, deux de ces copies ALU sont décrites comme une répétition inversée. Lorsqu'une répétition inversée est copiée dans l'ARN, les deux copies ALU se replient l'une sur l'autre pour former de l'ARN double brin. L'enzyme ADAR ne modifie que l'ARN double brin.

Les cellules cancéreuses produisent plus d'ADAR que les cellules normales pour empêcher l'ARN répété inversé de déclencher la réponse à l'interféron. Cela permet aux cellules cancéreuses d'échapper à la réponse immunitaire et de survivre. L'inhibition de l'ADAR est donc un moyen très efficace d'empêcher la croissance incontrôlée des cellules cancéreuses. Plus précisément, empêcher la liaison à l'ADN-Z empêche les cellules cancéreuses d'utiliser ADAR pour arrêter la réponse à l'interféron. Résoudre le mystère de la formation et de la fonction de l'ADN-Z s'est avéré avoir une immense valeur pratique potentielle dans la recherche de nouvelles stratégies pour lutter contre le cancer.

Le secret débloqué par Z-DNA : les Flipons
Chez InsideOutBio Inc., le Dr Alan Herbert a fait d'énormes progrès pour libérer le potentiel de l'ADN-Z dans le traitement du cancer. Le Dr Herbert a d'abord identifié ADAR comme une protéine de liaison à l'ADN-Z. Il a ensuite pu montrer comment la liaison à l'ADN-Z par ADAR désactive la réponse immunitaire. Il a analysé les familles qui ont des altérations du domaine de liaison de l'ADN-Z qui empêchent la liaison à l'ADN-Z. Les individus affectés ne peuvent plus désactiver la production d'interféron, une étape importante dans la régulation des réponses immunitaires. Leur système immunitaire est toujours actif, ce qui entraîne des maladies inflammatoires.

Le Dr Herbert a proposé le terme « flipons » pour décrire des séquences du génome humain qui peuvent adopter les conformations d'ADN droitier ou gaucher dans des conditions normales. De manière significative, les flipons ont la capacité de modifier la production d'ARN d'un gène. Dans certains cas, les flipons peuvent même agir comme un interrupteur « marche/arrêt » pour un gène – « on » avec une conformation, « off » avec l'autre. Dans d'autres situations, le retournement peut entraîner différentes modifications dans le message d'ARN, provoquant la production de différentes variantes de protéines. Surtout, tout cela se produit sans aucun changement dans la séquence d'ADN. Le flip permet une réponse rapide des cellules à différents défis environnementaux.

Les cellules cancéreuses utilisent l'ADAR et l'édition d'ARN pour fabriquer des protéines qui leur confèrent un avantage de survie.

Ces capacités soulèvent naturellement la question : qu'est-ce qui contrôle si les flipons sont droitiers ou gauchers ? Le basculement de l'ADN droitier à gaucher nécessite de l'énergie. Une source possible de cette énergie est celle générée par les enzymes qui copient l'ADN en ARN. Lorsqu'un gène fabrique activement de l'ARN, les flipons sont plus susceptibles d'être poussés dans la conformation gaucher. Le flip est favorisé dans les régions des gènes (appelées promoteurs) où commence la transcription de l'ARN. En effet, les séquences flipon sont plus fréquentes dans les promoteurs, c'est-à-dire qu'elles sont souvent localisées dans des régions où elles peuvent réguler l'activité des gènes.

Que peuvent faire les flipons ?
Parfois, l'ADN est endommagé (par exemple, par exposition à des radiations ou à des substances qui provoquent des mutations). Dans ces circonstances, en raison de la façon dont les bases de l'ADN sont modifiées, moins d'énergie est nécessaire pour pousser les flipons vers l'ADN-Z. Cela permet aux flipons d'agir comme des capteurs de dommages à l'ADN. Le « flip » permet à la cellule de répondre au défi et de réparer les dégâts. Pour ce faire, le flipon change l'ARN fabriqué par une cellule, provoquant ainsi l'exécution d'un ensemble différent de programmes génétiques.

Les flipons sont très dynamiques. Ils activent et désactivent constamment certaines parties du génome en réponse aux changements de l'environnement. En utilisant des flipons pour modifier la lecture de l'ARN, l'ADN peut stocker différents ensembles d'informations en utilisant la même séquence de bases génomiques.

Comme pour toute autre variation génétique, les flipons sont sujets à des changements évolutifs. Ils peuvent être insérés, supprimés ou perdre leur capacité à adopter la conformation Z-DNA. En conséquence, de nouveaux programmes génétiques apparaissent et d'autres fonctionnent différemment. Ceux qui offrent un avantage évolutif sont transmis à la génération suivante. Les répétitions ALU contiennent des séquences flipon qui forment l'ADN-Z. Ils basculent dans la conformation Z-DNA chaque fois que l'ARN est fabriqué à partir de l'élément répété ALU. L'ADN-Z permet la localisation d'ADAR aux répétitions à travers une partie particulière de l'enzyme, appelée le domaine Zα. Lorsque les flipons ALU sont copiés vers d'autres sites du génome, ils modifient les ARN qui y sont fabriqués. Ce processus crée de nouveaux programmes génétiques sur lesquels la sélection naturelle doit agir.

Dans certains cas, les flipons peuvent même agir comme un on/off
passer pour un gène.

Les mutations ADAR provoquent des maladies génétiques héréditaires
Le principal défi pour percer le mystère de l'ADN-Z était de montrer qu'il avait une fonction biologique. Cela s'est avéré difficile, car la formation d'ADN-Z est très dynamique - cela peut arriver, par exemple, en raison des conditions utilisées dans une expérience particulière. Cela ne signifie pas nécessairement que l'ADN-Z se forme de cette façon dans la nature.

Une façon de s'attaquer à ce problème est d'observer la génétique humaine. Dans ces études, il n'y a pas d'intervention expérimentale, donc tout ADN-Z peut être supposé s'être formé naturellement. Le défi, cependant, est de trouver un phénotype (ou une caractéristique observable) qui fournit les informations nécessaires. Le Dr Herbert a trouvé une solution sous la forme de mutations de l'ADN qui inactivent le domaine Zα d'ADAR. L'analyse du Dr Herbert a montré que les mutations qui empêchaient ADAR de se lier à l'ADN-Z sont responsables de deux maladies humaines génétiquement héréditaires : le syndrome d'Aicardi-Goutières (AGS) et la nécrose/dystonie striatale bilatérale (BSD). Ces conditions sont étroitement liées : toutes deux provoquent des déficiences dans la régulation des interférons. L'AGS affecte le cerveau et la peau, provoquant d'importants problèmes intellectuels et physiques, tandis que la BSD affecte le mouvement et la vision. Ces conditions génétiques débilitantes fournissent une preuve sans ambiguïté d'un rôle biologique pour l'ADN-Z.

Les flipons sont très dynamiques. Ils activent et désactivent constamment certaines parties du génome en réponse aux changements de l'environnement.

Cibler l'ADAR dans le cancer
La surexpression d'ADAR s'est avérée se produire dans de nombreux types de cancer, y compris le cancer du sein et du poumon. En culture cellulaire, plus de 40 % des cancers dépendent d'ADAR pour leur survie. Chez la souris, il existe des preuves expérimentales que la suppression d'ADAR améliore la réponse à l'immunothérapie, en particulier lorsqu'elle est associée à des inhibiteurs de point de contrôle (médicaments qui aident le système immunitaire à lutter contre le cancer). Cibler les voies régulées par les flipons, plutôt que simplement les mutations génétiques de l'ADN, est une toute nouvelle façon de traiter le cancer.

D'autres thérapies sont en cours de développement et utilisent l'édition d'ARN pour traiter les maladies génétiques. Ici, ADAR recode les ARN qui ont des mutations qui conduisent à la maladie. Des efforts sont en cours pour améliorer l'efficacité de l'édition en ciblant les domaines Zα d'ADAR. L'approche évite les modifications permanentes de l'ADN apportées à l'aide d'enzymes telles que CRISPR avec ces enzymes, une altération involontaire pourrait produire des résultats négatifs.

Un avenir passionnant
La récente découverte des flipons montre que notre ADN détient de nombreux secrets qui peuvent demander beaucoup de travail à découvrir. Les recherches perspicaces du Dr Herbert sur l'ADN-Z - une forme d'ADN qui était, jusqu'à récemment, à peine comprise - nous montrent à quel point nous avons encore à apprendre sur notre ADN. Le passage de l'ADN B à l'ADN Z qui crée des flipons peut clairement avoir un impact important sur la façon dont nos cellules réagissent à leur environnement et à des maladies comme le cancer. Cette nouvelle compréhension offre de l'espoir pour de nouvelles thérapies individuelles ciblées dans la médecine moderne, nous rapprochant d'une véritable médecine personnalisée.

Réponse personnelle

Quelle direction devraient prendre les futures recherches sur les flipons

Avec les progrès de la microscopie, nous pourrons voir les flipons changer de conformation en temps réel. Ces études nous permettront de comprendre ce qui les fait basculer et les conséquences qui en découlent. Le développement de petites molécules spécifiques qui empêchent ADAR de se lier à la conformation Z augmentera également la compréhension des processus biologiques régulés par les flipons. En combinaison, les approches microscopiques et petites molécules ouvriront une nouvelle fenêtre sur la biologie des cellules et fourniront de nouvelles informations sur la façon dont les cellules se développent, sur les voies qui mènent à la maladie et sur la façon dont la vie évolue pour sortir du chaos.


Akgün, E., Zahn, J., Baumes, S., Brown, G., Liang, F., Romanienko, P.J., Lewis, S. et Jasin, M. 1997. Palindrome resolution and recombinaison in the mammalian germ line. Mol. Cellule. Biol. 17 : 5559-5570.

Angell, S.M. et Baulcombe, D.C. 1997. Silençage génique cohérent dans des plantes transgéniques exprimant un ARN X du virus de la pomme de terre en réplication. EMBO J. 16 : 3675-3684.

Assaad, F.F., Tucker, K.L. et Signer, E.R. 1993. Silençage génique induit par la répétition épigénétique (RIGS) dans Arabidopsis. Plante Mol. Biol. 22 : 1067-1085.

Baulcombe, D.C. et English, J.J. 1996. Appariement ectopique d'ADN homologue et silençage post-transcriptionnel dans les plantes transgéniques. Cour. Avis. Biotechnologie. 7 : 173-180.

Bender, J. 1998. Cytosine méthylation de séquences répétées chez les eucaryotes: le rôle de l'appariement de l'ADN. Tendances Biochem. Sci. 23 : 252-256.

Bender, J. et Fink, G.R. 1995. Le contrôle épigénétique d'une famille de gènes endogènes est révélé par un nouveau mutant fluorescent bleu de Arabidopsis. Cellule 83 : 725-734.

Bestor, T.H. 1987. Spécificité de séquence dépendante du superenroulement de l'ADN méthyltransférase de mammifère. Nucl. Acides Rés. 15 : 3835-3843.

Bestor, T.H. et Coxon, A. 1993. Méthylation de la cytosine : les avantages et les inconvénients de la méthylation de l'ADN. Cour. Biol. 3 : 384-386.

Bi, X. et Liu, L.F. 1996. Réarrangement de l'ADN médié par des répétitions inversées. Proc. Natl. Acad. Sci. États-Unis 93 : 819-823.

Bird, A.P. et Wolffe, A.P. 1999. Répression induite par la méthylation : ceintures, accolades et chromatine. Cellule 99 : 451-454.

Blaho, A.J., Larson, J.E., McLean, M.J. et Wells, R.D. 1988. Structures secondaires d'ADN multiples dans des inserts répétés inversés parfaits dans des plasmides. J. Biol. Chem. 263 : 14446-14455.

Bollmann, J., Carpenter, R. et Coen, E.S. 1991. Interactions alléliques au nivea lieu de Muflier. Cellule végétale 3 : 1327-1336.

Christou, P. 1992. Transformation génétique des plantes cultivées par bombardement de microprojectiles. Plante J. 2: 275-281.

Cluster, P., O'Dell, M., Metzlaff, M. et Flavell, R.B. 1996. Détails de l'organisation structurelle de l'ADN-T d'un transgénique Pétunia population présentant une co-suppression. Plante Mol. Biol. 32 : 1197-1203.

Coen, E.S. et Carpenter, R. 1988. Un allèle semi-dominant, niv-525, actes en trans pour inhiber l'expression de son homologue sauvage dans Antirrhinum majus. EMBO J. 7 : 877-883.

Cogoni, C. et Macino, G. 1999. Silençage génique dépendant de l'homologie chez les plantes et les champignons : un certain nombre de variations sur le même thème. Cour. Avis. Microbiole. 2: 657-662.

Collick, A., Drew, J., Penberth, J., Bois, P., Luckett, J., Scaerou, F., Jeffreys, A. et Reik, W. 1996. Instability of long inverted repeats within mouse transgenes. EMBO J. 15 : 1163–1171.

Collins, J. 1980. Instabilité de l'ADN palindromique dans Escherichia coli. Symptôme du port de Cold Spring. Quant. Biol. 45 : 409-416.

Collins, J., Volkaert, G. et Nevers, P. 1982. Excision précise et presque précise des répétitions inversées symétriques des caractéristiques communes de Tn5 de recA-événements de suppression indépendants dans Escherichia coli. Gène 19 : 139-146.

Colot, V., Maloisel, L. et Rossignol, J.L. 1996. Interchromosomal transfer of epigenetic states in Ascobole: le transfert de la méthylation de l'ADN est mécaniquement lié à la recombinaison homologue. Cellule 86 : 855-864.

DasGupta, U., Weston-Hafer, K. et Berg, D.E. 1987. Contrôle de séquence d'ADN local de la formation de délétion dans Escherichia coli plasmide pBR322. Génétique 115 : 41-49.

Dehio, C. et Schell, J. 1994. Identification de loci génétiques végétaux impliqués dans un mécanisme post-transcriptionnel pour l'extinction méiotiquement réversible des transgènes. Proc. Natl. Acad. Sci. États-Unis 91 : 5538–5542.

De Neve, M., De Buck, S., Jacobs, A., Van Montagu, M. et Depicker, A. 1997. Les modèles d'intégration d'ADN-T dans les cellules végétales cotransformées suggèrent que les répétitions d'ADN-T proviennent de la co-intégration de ADN-T séparés. Plante J. 11 : 15-29.

Depicker, A., Ingelbrecht, I., Van Houdt, H., De Loose, M. et Van Montagu, M. 1996. Post-transcriptional reporter transgene silencing dans le tabac transgénique. Dans : D. Grierson, G.W. Lycett et G.A. Tucker GA (Eds.) Mécanismes et applications du silencing génique, Nottingham University Press, Nottingham, Royaume-Uni, pp. 71-84.

Dorer, D.R. 1997. Les puces transgéniques forment-elles de l'hétérochromatine chez les vertébrés ? Transgen. Rés. 6 : 3-10.

Dorer, D.R. et Henikoff, S. 1994. Les expansions des répétitions transgéniques provoquent la formation d'hétérochromatine et l'extinction des gènes dans Drosophile. Cellule 77 : 993–1002.

Dorer, D.R. et Henikoff, S. 1997. Les puces à répétition transgénique interagissent avec l'hétérochromatine distante et provoquent un silence en cis et trans. Génétique 147 : 1181-1190.

Ehrlich, S.D. 1989. Recombinaison illégitime chez les bactéries. Dans : D.E. Berg et M.M. Howe (Eds.)Mobile DNA, American Society for Microbiology, Washington, D.C., pp. 799-832.

Elmayan, T. et Vaucheret, H. 1996. Un transgène 35S fortement exprimé subit un silence post-transcriptionnel dans tous les transformants du tabac quel que soit le nombre de copies. Plante J. 9 : 787-797.

English, J.J., Mueller, E. et Baulcombe, D.C. 1996. Suppression de l'accumulation de virus dans les plantes transgéniques présentant l'extinction des gènes nucléaires. Cellule végétale 8 : 179-188.

English, J.J., Davenport, G.F., Elmayan, T., Vaucheret, H. et Baulcombe, D.C. 1997. Requirement of sense transcription for homology-dependent virus resistance and trans-inactivation. Plante J. 12 : 597-603.

Faugeron. G., Rhounim, L. et Rossignol, J.-L. 1990. Comment la cellule compte-t-elle le nombre de copies ectopiques d'un gène dans le processus d'inactivation préméiotique agissant dans Ascobolus immersus. Génétique 135 : 357-366.

Fire, A. 1999. Silençage génique déclenché par l'ARN. Tendances Genet. 15 : 358-363.

Fire, A., Xu, S.Q., Montgomery, M.K., Kostas, S.A., Driver, S.E. et Mello, C.C. 1998. Interférence génétique puissante et spécifique par l'ARN double brin dans Caenorhabditis elegans. Nature 391 : 806-811.

Garrick, D., Fiering, S., Martin, D.I.K. et Whitelaw, E. 1998. Silençage génique induit par la répétition chez les mammifères. Genêt nature. 18 : 56-59.

Goodwin, J., Chapman, K., Swaney, S., Parks, T.D., Wernsman, E.A. et Dougherty, W.G. 1996. Dissection génétique et biochimique de la résistance virale à médiation par l'ARN transgénique. Cellule végétale 8 : 95-105.

Gordenin, D.A., Lobachev, K.S., Degtyareva, N.P., Malkova, A.L., Perkins, E. et Resnick, M.A. 1993. Répétitions d'ADN inversées : une source d'instabilité génomique eucaryote. Mol. Cellule. Biol. 13 : 5315–5322.

Goyon, C., Nogueira, T.I.V. et Faugeron, G. 1994. Perpetuation of cytosine methylation in Ascobolus immersus implique un nouveau type de méthylase d'entretien. J. Mol. Biol. 240 : 42-51.

Hamilton, A.J., Brown, S., Han, Y.H., Ishizuka, M., Lowe, A., Solis, A.G.A. et Grierson, D. 1998. Un transgène avec un ADN répété provoque une suppression post-transcriptionnelle à haute fréquence de l'expression du gène de l'ACCoxydase chez la tomate. Plante J. 15 : 737-746.

Hanke, J.H., Hambor, J.E. et Kavathas, P. 1995. Répétitif Alu Les éléments forment une structure cruciforme qui régule la fonction de l'activateur spécifique des cellules T CD8a humaines. J. Mol. Biol. 246 : 63-73.

Henikoff, S. et Comai, L. 1998. Effets transsensoriels : les hauts et les bas d'être ensemble. Cellule 93 : 329-332.

Hobbs, S.L.A., Kpodar, P. et Delong, C.M.O. 1990. L'effet du nombre de copies d'ADN-T, de la position et de la méthylation sur l'expression du gène rapporteur dans les transformants du tabac. Plante Mol. Biol. 15 : 851-864.

Hobbs, S.L.A., Warkentin, T.D. et Delong, C.M.O. 1993. Le nombre de copies du transgène peut être associé positivement ou négativement à l'expression du transgène. Plante Mol. Biol. 21 : 17-26.

Hollick, J.B., Dorweiler, J.E. et Chandler, V.L. 1997. Paramutation et interactions alléliques associées. Tendances Genet. 13 : 302–308.

Ingelbrecht, I. 1993. Analyse de 30 signaux de traitement et étude du silençage transgénique dans Nicotiana tabacum. doctorat thèse, Universiteit Gent, Gent, Belgique.

Jakowitsch, J., Papp, I., Moscone, E.A., vanderWinden, J., Matzke, M. et Matzke, A.J.M. 1999. Caractérisation moléculaire et cytogénétique d'un locus transgénique qui induit l'extinction et la méthylation des promoteurs homologues en trans. Plante J. 17 : 131-140.

Jeddeloh, J.A., Stokes, T.L. et Richards, E.J. 1999. Le maintien de la méthylation génomique nécessite une protéine de type SWI2/SNF2. Genêt nature. 22 : 94-96.

Jones, A.L., Thomas, C.L. et Maule, A.J. 1998. Méthylation de novo et co-suppression induite par un virus à ARN végétal à réplication cytoplasmique. EMBO J. 17 : 6385-6393.

Jorgensen, R., Snyder, C. et Jones, J.D.G. 1987. L'ADN-T est organisé principalement en structures répétées inversées chez les plantes transformées avec Agrobacterium tumefaciens C58 dérivés. Mol. Le général Genet. 207 : 471-477.

Jorgensen, R., Cluster, P., Que, Q., English, J. et Napoli, C. 1996. Phénotypes de cosuppression de la chalcone synthase dans les fleurs de pétunia: comparaison des constructions sens vs antisens et copie unique vs ADN-T complexe séquences. Plante Mol. Biol. 31 : 957-973.

Kennerdell, J.R. et Carthew, R.W. 1998. Utilisation de l'interférence génétique induite par l'ARNdb pour démontrer que crépus et crépus 2 agissent dans la voie sans ailes. Cellule 95 : 1017-1026.

Ketting, R.F., Haverkamp, ​​T.H.A., van Luenen, H.G.A.M. et Plasterk, R.H.A. 1999. mut-7 de C. elegans, requis pour le silençage des transposons et l'interférence ARN, est un homologue de l'hélicase du syndrome de Werner et de la RNaseD. Cellule 99 : 133-141.

Konokov, M., Bassuner, B. et Gelvin, S. 1997. Intégration de séquences de squelette de vecteur binaire d'ADN-T dans le génome du tabac : preuve de plusieurs modèles complexes d'intégration. Plante J. 11 : 945-957.

Kooter, J.M., Matzke, M.A. et Meyer, P. 1999. Écouter les gènes silencieux : la recherche sur le silençage transgénique identifie de nouveaux mécanismes de régulation des gènes et de contrôle des agents pathogènes. Tendances Plant Sci. 4 : 340-347.

Kumagai, M.H., Donson, J., Dellacooppa, G., Harvey, D., Hanley, K. et Grill, L.K. 1995. Inhibition cytoplasmique de la biosynthèse des caroténoïdes avec l'ARN dérivé du virus. Proc. Natl. Acad. Sci. États-Unis 92 : 1679-1683.

Leach, D.R.F. 1994. Longs palindromes, structures cruciformes, instabilité génétique et réparation des structures secondaires. BioEssays 16 : 893-900.

Leach, D.R.F. et Stahl, F.W. 1983. Viabilité des phages lambda portant un palindrome parfait en l'absence de nucléases de recombinaison. Nature 305 : 448–451.

Lilley, D.M.J. 1981. In vivo conséquences de la topologie plasmidique. Nature 292 : 380-382.

Lindbo, J.A., Silva-Rosales, L., Proebsting, W.M. et Dougherty, W.G. 1993. Induction d'un état antiviral hautement spécifique dans les plantes transgéniques : implications pour la régulation de l'expression des gènes et de la résistance aux virus. Cellule végétale 5 : 1749-1759.

Lobatchev, K.S., Shor, B.M., Tran, H.T., Taylor, W., Keen, J.D., Resnick, M.A. et Gordenin, D.A. 1998. Facteurs affectant la stimulation répétée inversée de la recombinaison et de la suppression dans Saccharomyces cerevisiae. Génétique 148 : 1507-1524.

Lloyd, R.G. et Buckman, C. 1985. Identification et analyse génétique de sbcC mutations couramment utilisées recBC sbcB souches de Escherichia coli K-12. J. Bact. 164 : 836-844.

Luff, B., Pawlowski, L. et Bender, J. 1999. Une répétition inversée déclenche la méthylation de la cytosine de séquences identiques dans Arabidopsis. Mol. Cellule 3 : 505-511.

Martienssen, R. 1996. Phénomènes épigénétiques : paramutation et silençage génique chez les plantes. Cour. Biol. 6 : 810-813.

Matzke, M.A. et Matzke, A.J.M. 1998. Silençage épigénétique des transgènes végétaux à la suite de diverses réponses de défense cellulaire. Cellule. Mol. Science de la vie. 54 : 94-103.

Matzke, A.J.M., Neuhuber, F., Park, Y.D., Ambros, P.F. et Matzke, M.A. 1994. Silençage génique dépendant de l'homologie dans les plantes transgéniques : les loci de silençage épistatique contiennent plusieurs copies de transgènes méthylés. Mol. Le général Genet. 244 : 219-229.

Matzke, M.A., Matzke, A.J.M. et Eggelston, W.B. 1996. Paramutation et silençage transgénique : une réponse commune à l'ADN invasif ? Tendances Plant Sci. 1 : 382-388.

Mette, M.F., van der Winden, J., Matzke, M.A. et Matzke, A.J.M. 1999. La production de transcrits de promoteurs aberrants contribue à la méthylation et à l'extinction des promoteurs homologues non liés en trans. EMBO J. 18 : 241-248.

Meyer, P., Heidmann, I. et Niedenhof, I. 1993. Les différences de méthylation de l'ADN sont associées à un phénomène de paramutation dans le pétunia transgénique. Plante J. 4: 89-100.

Meyer, P., Niedenhof, I. et ten Lohuis, M. 1994. Preuve de la méthylation de la cytosine de séquences non symétriques en transgénique Pétunia hybrida. EMBO J. 13 : 2084-2088.

Meyer, P. et Saedler, H. 1996. Silençage génique dépendant de l'homologie chez les plantes. Annu. Rev. Plante Physiol. Plante Mol. Biol. 47 : 23-48.

Montgomery, M.K., Xu, S.Q. et Fire, A. 1998. L'ARN en tant que cible de l'interférence génétique médiée par l'ARN double brin dans Caenorhabditis elegans. Proc. Natl. Acad. Sci. États-Unis 95 : 15502-15507.

Nan, X.S., Ng, H.H., Johnson, C.A., Laherty, C.D., Turner, B.M., Eisenman, R.N. et Bird, A. 1998. La répression transcriptionnelle par la protéine de liaison au méthyle-CpG MeCP2 implique un complexe d'histone désacétylase. Nature 393 : 386-389.

Ngô, H., Tschudi, C., Gull, K. et Ullu, E. 1998. L'ARN double brin induit la dégradation de l'ARNm dans Trypanosoma brucei. Proc. Natl. Acad. Sci. États-Unis 95 : 14687-14692.

Palauqui, J.C. et Balzergue, S. 1999. Activation de l'extinction systémique acquise par introduction localisée d'ADN. Cour. Biol. 9 : 59-66.

Park, Y-D., Papp, I., Moscone, E.A., Iglesias, V.A., Vaucheret, H., Matzke, A.J.M. et Matzke, M.A. 1996. L'inactivation génique médiée par l'homologie du promoteur se produit au niveau de la transcription et entraîne des altérations méiotiques héréditaires de la méthylation et de l'activité génique. Plante J. 9 : 183-194.

Pawlowski, W.P. et Somers, D.A. 1998. L'ADN transgénique intégré dans le génome de l'avoine est fréquemment intercalé par l'ADN de l'hôte. Proc. Natl. Acad. Sci. États-Unis 95 : 12106-12110.

Pélissier, T., Thalmeir, S., Kempe, D., Sanger, H.L. et Wassenegger, M. 1999. Heavy de novo la méthylation sur des sites symétriques et non symétriques est une caractéristique de la méthylation de l'ADN dirigée par l'ARN. Nucl. Acides Rés. 27 : 1625-1634.

Que, Q.D., Wang, H.Y., anglais, J.J. et Jorgensen, R.A. 1997.La fréquence et le degré de cosuppression par les transgènes sens de la chalcone synthase dépendent de la force du promoteur du transgène et sont réduits par des codons non-sens prématurés dans la séquence codante du transgène. Cellule végétale 9 : 1357-1368.

Rossignol, J.L. et Faugeron, G. 1995. MIP: an epigenetic gene silencing process in Ascobolus immersus. Dans : P. Meyer (Ed.) Gene Silencing in Higher Plants and Related Phenomena in Other Eucaryotes, Springer-Verlag, Berlin, pp. 179-191.

Ruiz, M.T., Voinnet, O. et Baulcombe, D.C. 1998. Initiation et maintenance du silençage génique induit par le virus. Cellule végétale 10 : 937-946.

Saedler, H. et Nevers, P. 1985. Transposition dans les plantes : un modèle moléculaire. EMBO J. 4: 585-590.

Sanchez Alvardo, A. et Newmark, P.A. 1999. L'ARN double brin perturbe spécifiquement l'expression des gènes pendant la régénération planaire. Proc. Natl. Acad. Sci. États-Unis 96 : 5049-5054.

Selker, UE 1993. Contrôle de la méthylation de l'ADN chez les champignons. Dans : J.P. Jost et H.P. Saluz (Eds.) DNA Methylation: Molecular Biology and Biological Signification, Birkhäuser Verlag, Bâle, pp. 212-217.

Selker, UE 1998. La trichostatine A provoque une perte sélective de la méthylation de l'ADN dans Neurospora. Proc. Natl. Acad. Sci. États-Unis 95 : 9430-9535.

Selker, UE 1999. Silençage génique : répétitions qui comptent. Cellule 97 : 157-160.

Singer, M.J. et Selker, E.U. 1995. Inactivation génétique et épigénétique de séquences répétitives dans Neurospora crassa: RIP, méthylation de l'ADN et suppression. Dans : P. Meyer (Ed.) Gene Silencing in Higher Plants and Other Phenomena in Other Eucaryotes, Springer-Verlag, Berlin, pp. 165-178.

Sijen, T. et Kooter, J.M. 2000. Silence post-transcriptionnel : les ARN sur l'attaque ou sur la défensive ? BioEssays, sous presse.

Sijen, T., Wellink, J., Hiriart, J.B. et van Kammen, A. 1996. Résistance virale à médiation par l'ARN : rôle des transgènes répétés et délimitation des régions ciblées. Cellule végétale 8 : 2277-2294.

Stam, M., de Bruin, R., Kenter, S., van der Hoorn, R.A.L., van Blokland, R., Mol, J.N.M. et Kooter, J.M. 1997. Silençage post-transcriptionnel de la chalcone synthase dans Pétunia par des répétitions de transgène inversé. Plante J. 12 : 63-82.

Stam, M., Viterbo, A., Mol, J.N.M. et Kooter, J.M. 1998. Méthylation dépendante de la position et silençage transcriptionnel des transgènes dans les répétitions inversées d'ADN-T : Implications pour le silençage post-transcriptionnel de gènes hôtes homologues dans les plantes. Mol. Cellule. Biol. 18 : 6165-6177.

Stam, M., de Bruin, R., van Blokland, R., ten Hoorn, R.A.L., Mol, J.N.M. et Kooter, J.M. 2000. Distinct features of posttranscriptional gene silencing by antisens transgenes in single copy and inverted T-DNA repeat loci. Plante J. 21 : 27-42.

Stinard, P.S., Robertson, D.S. et Schnable, P.S. 1993. Isolement génétique, clonage et analyse d'un antimorphe dominant induit par mutateur du maïs extenseur d'amylose1 lieu. Cellule végétale 5 : 1555–1566.

Tabara, H., Sarkissian, M., Kelly, W.G., Fleenor, J., Grishok, A., Timmons, L., Fire, A. et Mello, C.C. 1999. Le gène rde-1, l'interférence ARN et l'extinction du transposon dans C. elegans. Cellule 99 : 123-132.

Tinland, B. 1996. L'intégration de l'ADN-T dans les génomes végétaux. Tendances Plant Sci. 1 : 178-184.

Todd, J.J. et Vodkin, L.O. 1996. Duplications qui suppriment et délétions qui restaurent l'expression d'une famille multigénique de chalcone synthase. Cellule végétale 8 : 687-699.

Tran, H., Degtyareva, N., Gordenin, D. et Resnick, M.A. 1997. La réplication altérée et les répétitions inversées induisent une recombinaison indépendante de la réparation des mésappariements entre des ADN très divergents chez la levure. Mol. Cellule. Biol. 17 : 1027-1036.

Trinh, T.Q. et Sinden, R.R. 1991. Mutagenèse préférentielle de la structure secondaire de l'ADN dans le brin retardé de la réplication de l'ADN dans E. coli. Nature 352 : 544-547.

van Blokland, R., van der Geest, N., Mol, J.N.M. et Kooter, J.M. 1994. Suppression à médiation transgénique de l'expression de la chalcone synthase dans Pétunia hybrida résulte d'une augmentation du renouvellement de l'ARN. Plante J. 6 : 861-877.

Van Houdt, H., Ingelbrecht, I., Van Montagu, M. et Depicker, A. 1997. L'extinction post-transcriptionnelle d'un transgène de néomycine phosphotransférase II est en corrélation avec l'accumulation d'ARN improductifs et avec une méthylation accrue de la cytosine. Plante J. 12 : 379-392.

Vaucheret, H. 1993. Identification d'un silencieux général pour les promoteurs 19S et 35S dans un plant de tabac transgénique : 90 pb d'homologie dans la séquence promotrice sont suffisantes pour la trans-inactivation. C. R. Acad. Sci. [III] 316 : 1471-1483.

Vaucheret, H., Elmayan, T., Mourrain, P. et Palauqui, J-C. 1996. Analyse d'un locus transgénique du tabac qui déclenche à la fois l'extinction transcriptionnelle et post-transcriptionnelle. Dans : Russo, V.E., Martienssen, R.A. et Riggs, A.D. (Eds.) Mécanismes épigénétiques de la régulation des gènes, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY, pp. 403-414.

Vaucheret, H., Béclin, C., Elmayan, T., Feuerbach, F., Godon, C., Morel, J-B., Mourrain, P., Palauqui, J-C. et Vernhettes, S. 1998. Silençage génique induit par transgène dans les plantes. Plante J. 16 : 651-659.

Vaucheret, H., Nussaume, L., Palauqui, J-C., Quillere, I. et Elmayan, T. 1997. Un état transcriptionnellement actif est requis pour le silençage post-transcriptionnel (cosuppression) des gènes hôtes et des transgènes de la nitrate réductase. Cellule végétale 9 : 1495-1504.

Voinnet, O., Vain, P., Angell, S. et Baulcombe, D.C. 1998. La propagation systémique de la dégradation de l'ARN transgénique spécifique à la séquence dans les plantes est initiée par l'introduction localisée d'ADN sans promoteur ectopique. Cellule 95 : 177-187.

Wade, P.A., Gegonne, A., Jones, P.L., Ballestar, E., Aubry, F. et Wolffe, A.P. 1999. Le complexe Mi-2 couple la méthylation de l'ADN au remodelage de la chromatine et à la désacétylation des histones. Genêt nature. 23 : 1-5.

Wassenegger, M. et Pélissier, T. 1998. Un modèle de silençage génique médié par l'ARN chez les plantes supérieures. Plante Mol. Biol. 37 : 349-362.

Wassenegger, M., Heimes, S., Riedel, L. et Sänger, H.L. 1994. RNA-directed de novo méthylation de séquences génomiques chez les plantes. Cellule 76 : 567-576.

Waterhouse, P.M., Graham, H.W. et Wang, M.B. 1998. La résistance aux virus et le silençage génique chez les plantes peuvent être induits par l'expression simultanée d'ARN sens et antisens. Proc. Natl. Acad. Sci. États-Unis 95 : 13959-13964.

Waterhouse, P.M., Smith, N.A. et Wang, M.B. 1999. Résistance aux virus et silençage génique : tuer le messager. Tendances Plant Sci. 4: 452-457.

Wenck, A., Czako, M., Kanevski, I. et Marton, L. 1997. Frequent colinéaire long transfert d'ADN incluant l'ensemble du vecteur binaire pendant Agrobactérie-transformation médiatisée. Plante Mol. Biol. 34 : 913-922.


Voir la vidéo: What is a function? Functions and their graphs. Algebra II. Khan Academy (Janvier 2022).