Caractéristiques générales
Le tableau 1 compare les caractéristiques générales de l’ADNc d’Oltmannsiellopsis avec celles des quatre ADNc chlorophytes complètement séquencés jusqu’à présent, i.e. les génomes de Nephroselmis, Chlorella, Pseudendoclonium et Chlamydomonas. À 59,5%, la teneur globale en A+T de l’ADNc d’Oltmannsiellopsis est similaire à celle de l’ADNc de Nephroselmis, mais est significativement plus faible que celle des trois génomes UTC précédemment séquencés. Le génome d’Oltmannsiellopsis se présente sous la forme d’une molécule circulaire de 151 933 pb (Figure 1) et contient 105 gènes. Deux copies d’une séquence IR de 18 510 pb, codant chacune dix gènes, sont séparées l’une de l’autre par des régions à copie unique inégales, désignées SC1 et SC2. Comme les autres CPDNA UTC, le génome d’Oltmannsiellopsis est moins dense en séquences codantes que les CPDNA Mesostigma et Nephroselmis; à 59,2%, sa densité de séquences codantes est similaire à celle des CPDNA Chlorella et Pseudendoclonium. Les espaceurs intergéniques de l’ADNCPC d’Oltmannsiellopsis présentent des DTS et ont une taille moyenne de 512 pb, une valeur comparable à celle observée pour l’ADNCPC de Pseudendoclonium (600 pb). Un total de cinq introns, qui appartiennent tous à la famille du groupe I, ont été identifiés dans l’adNPC d’Oltmannsiellopsis.
Teneurs en gènes et introns
La teneur en gènes de l’adNPC d’Oltmannsiellopsis est intermédiaire entre celles de l’ADNPC de Chlorella et de Chlamydomonas (Tableau 1). Bien qu’Oltmannsiellopsis et Pseudendoclonium CPDNA codent le même nombre de gènes, ces génomes diffèrent légèrement dans leur répertoire de gènes (tableau 2). L’adNCP d’Oltmannsiellopsis a conservé les trois gènes chl qui sont absents de l’adNCP de Pseudendoclonium, mais a perdu ycf62, trnL (caa) et trnR (ccg). Par rapport à l’adNPC de Chlorella, il manque aux génomes d’Oltmannsiellopsis, de Pseudendoclonium et de Chlamydomonas un ensemble de cinq gènes, c.-à-d. cysA, kyste et trois gènes d’ARNt (trnL (gag), trnS (gga) et trnT (ggu)) (Tableau 2). L’absence de trois gènes (ycf62, trnL (caa) et trnR (ccg)) est uniquement partagée par Oltmannsiellopsis et Chlamydomonas CPDNA, alors qu’aucune perte de gène spécifique n’est partagée par Pseudendoclonium et Chlamydomonas CPDNA. Les ADNC d’Oltmannsiellopsis et de Pseudendoclonium ont tous deux conservé le gène de l’ARNT (ccu), qui est absent de tous les autres ADNC chlorophytes complètement séquencés.
Comme dans les génomes du chloroplaste UTC précédemment étudiés, les régions codantes de plusieurs gènes de l’ADNCPC d’Oltmannsiellopsis sont élargies par rapport à leurs homologues du Mésostigma (Tableau 3). Cependant, la plupart des expansions de gènes chez Oltmannsiellopsis sont moins étendues que celles du Pseudendoclonium ; seul le cemA présente une séquence codante plus longue que son homologue du Pseudendoclonium.
Notre découverte de cinq introns du groupe I dans l’ADNCPC d’Oltmannsiellopsis contraste fortement avec les 27 introns du groupe I trouvés dans l’ADNCPC de Pseudendoclonium (tableau 1). La faible abondance d’introns dans l’ADNc d’Oltmannsiellopsis explique principalement la plus petite taille de ce génome par rapport à l’ADNc de Pseudendoclonium. Les introns d’Oltmannsiellopsis interrompent trois gènes (petB, psbA et rrl) trouvés dans l’IR (tableau 4). Les gènes petB et psbA contiennent chacun un intron, alors que trois introns sont présents dans rrl. Les cinq introns, à l’exception de l’intron petB, sont homologues de position et de structure aux introns précédemment signalés dans les ADNC des plantes vertes (tableau 5). Alors que des homologues de l’intron psbA d’Oltmannsiellopsis sont présents dans le Pseudendoclonium et le Chlamydomonas, les homologues des trois introns rrl se trouvent dans une plus grande diversité de plantes vertes. Considérant que ces introns homologues ont été identifiés dans des lignées UTC, ils auraient pu être hérités par héritage vertical du dernier ancêtre commun des algues UTC ; cependant, la constatation qu’ils codent potentiellement pour des endonucléases d’origine des familles LAGLIDADG ou GIY-YIG (tableau 4) ne nous permet pas d’exclure la possibilité qu’ils aient été acquis par transfert horizontal. Bien que la plupart des 16 introns du groupe I de l’ADNCPC de Pseudendoclonium n’aient pas d’homologues à des sites apparentés identiques dans d’autres génomes de chloroplastes, leurs similitudes structurelles et de séquence étroites ainsi que leur absence dans l’ADNCPC d’Oltmannsiellopsis suggèrent qu’ils proviennent d’une prolifération intragénomique dans la lignée menant au Pseudendoclonium. Il est à noter que les recherches par explosion de la séquence d’introns petB d’Oltmannsiellopsis dans la base de données GenBank n’ont pas permis de détecter d’introns homologues chez d’autres organismes.
Structure du génome et partitionnement des gènes
Le modèle de partitionnement des gènes dans les régions à copie unique de l’adNPC d’Oltmannsiellopsis diffère considérablement du modèle de partitionnement ancestral observé pour les ADNPC de Mésostigma, de Néphroselme et de streptophytes (Figure 1). La grande majorité des 30 gènes trouvés dans la région SC1 d’Oltmannsiellopsis se trouvent généralement dans la région LSC ancestrale, alors que la région SC2 contient 52 gènes caractéristiques de la région LSC ancestrale en plus de dix gènes caractéristiques de la région SSC ancestrale. Fait intéressant, SC2 comprend 12 des 14 gènes LSC qui ont été transférés dans la région SSC dans l’adNPC Pseudendoclonium. Les deux gènes Pseudendoclonium exceptionnels qui n’ont pas d’homologues chez Oltmannsiellopsis SC2 sont trnH (gug) et trnL (caa); le gène trnH (gug) réside dans la région SC1 d’Oltmannsiellopsis, alors que le gène trnL (caa) a été perdu de l’adNPC d’Oltmannsiellopsis. Compte tenu du contenu génétique des régions à copie unique d’Oltmannsiellopsis, il semble inapproprié d’étiqueter ces régions en fonction de leurs tailles. Bien que SC1 soit plus petit que SC2, il correspond probablement à la région LSC ancestrale, et SC2 est apparemment dérivé de la région SSC ancestrale.
La séquence IR de l’adNPC d’Oltmannsiellopsis est environ 12 kb plus grande que celle de l’adNPC de Pseudendoclonium et contient cinq gènes en plus de ceux trouvés dans l’opéron de l’ARNr (Figure 1). À 18 510 pb, la séquence IR d’Oltmannsiellopsis est de taille similaire à celle de Chlamydomonas (tableau 1). Les deux jonctions IR dans l’adNPC d’Oltmannsiellopsis englobent des gènes (cemA et ftsH) dont les séquences codantes s’étendent dans les régions à copie unique. Comme dans le Pseudendoclonium IR, les gènes de l’ARNr d’Oltmannsiellopsis sont transcrits vers la région à copie unique portant les gènes qui se mappent au LSC dans les ADNC prasinophytes et streptophytes. En revanche, l’opéron de l’ARNr est transcrit vers la région SSC dans les CPDNA néphroselmis et streptophytes. L’orientation de l’opéron de l’ARNr ne peut pas être établie dans l’ADNc de Chlamydomonas en raison des régions à copie unique largement brouillées, et cette orientation reste inconnue dans l’ADNc de Chlorella en raison de la perte d’IR.
Considérant que les Oltmannsiellopsis et les Pseudendoclonium représentent des lignées distinctes et divergentes précoces des Ulvophycées, les similitudes frappantes entre les architectures quadripartites des CPDNA d’Oltmannsiellopsis et de Pseudendoclonium suggèrent que le modèle atypique de partitionnement des gènes et l’orientation inhabituelle de l’IR étaient caractéristiques du génome chloroplastique des ulvophytes les plus divergentes. Nos données prédisent que la région SSC du dernier ancêtre commun des ADNC Oltmannsiellopsis et Pseudendoclonium comportait 12 des gènes habituellement trouvés dans la région LSC dans les ADNC Néphroselmis et streptophytes, alors que la région LSC contenait exclusivement des gènes caractéristiques de la région LSC ancestrale. Par conséquent, dans la lignée menant au Pseudendoclonium, deux gènes supplémentaires ont été transférés dans la région SSC, alors que 40 gènes supplémentaires ont migré vers cette région dans la lignée Oltmannsiellopsis. Bien que les mécanismes sous-jacents à ces migrations de gènes entre régions à copie unique restent inconnus, ils ont probablement impliqué des événements de recombinaison intramoléculaires ou intermoléculaires. L’analyse des groupes de gènes conservés rapportée ci-dessous indique clairement que plusieurs gènes ont été transférés ensemble au cours de ces migrations.Les gènes
ont été plus largement mélangés entre les deux régions à copie unique de l’adNPC de Chlamydomonas (Figure 1). On peut imaginer qu’au cours de l’évolution des ulvophytes et des algues vertes chlorophycéennes, le modèle ancestral de partitionnement des gènes a été perturbé par étapes successives, une organisation ressemblant à un Pseudendoclonium évoluant en une organisation ressemblant à un Oltmannsiellopsis, conduisant finalement au brouillage étendu des gènes observés chez les Chlamydomonas. Étant donné l’absence de l’IR dans le génome de la Chlorelle, il est très difficile de déterminer si la direction de transcription de l’opéron de l’ARNr a changé et si les gènes ont été déplacés d’une région génomique à une autre au cours de l’évolution des trébouxiophytes. La perte de l’IR est généralement associée à de nombreux réarrangements de gènes; dans le cas de l’adNPC de Chlorella, cependant, tous les gènes habituellement trouvés dans la région ancestrale de la SSC sont restés groupés, à l’exception de trois gènes (afpC, ycf20 et trnL (uag)) (Figure 1). Des recherches sur des génomes chloroplastiques contenant des IR provenant de lignées distinctes de trébouxiophytes seront nécessaires pour vérifier si certaines des relocalisations de gènes identifiées ici dans les ADN CPDNAS Oltmannsiellopsis et Pseudendoclonium proviennent de l’ancêtre commun des algues UTC.
Regroupement de gènes
L’organisation génique globale de l’adNPC d’Oltmannsiellopsis diffère considérablement de celle de son homologue de Pseudendoclonium et, étonnamment, ressemble plus étroitement à celle de l’adNPC de Chlorella (Figure 2). Les ADNC Oltmannsiellopsis et Chlorella partagent 21 blocs de séquences colinéaires contenant un total de 65 gènes, alors que les ADNC Oltmannsiellopsis et Pseudendoclonium ont en commun 18 blocs contenant 55 gènes. Seuls huit blocs contenant 19 gènes sont conservés dans les génomes d’Oltmannsiellopsis et de Chlamydomonas.
Un grand nombre des 24 groupes de gènes ancestraux partagés par les CPDNA Mesostigma et Nephroselmis ont été perturbés au cours de l’évolution de l’algue verte UTC. Dans cette étude, nous avons analysé 19 clusters ancestraux; les cinq autres n’ont pas pu être étudiés car les gènes qu’ils contiennent ont été perdus à partir de CPDNA UTC (Figure 3). Les 19 amas ont été brisés au moins en une occasion au cours de l’évolution de l’algue UTC. Avec seulement 12 points d’arrêt, l’adNPC de Chlorella affiche la plus forte conservation des amas ancestraux. Avec 20 points d’arrêt, l’ADNc d’Oltmannsiellopsis occupe une position médiane entre les ADNc de Chlorella et de Pseudendoclonium (24 points d’arrêt), tandis que l’ADNc de Chlamydomonas révèle deux fois plus de points d’arrêt (42 points d’arrêt). Les génomes de Chlamydomonas, d’Oltmannsiellopsis et de Pseudendoclonium partagent cinq points d’arrêt qui manquent dans l’adNPC de Chlorella. En dehors de ces points d’arrêt, les CPDNA de Pseudendoclonium et de Chlamydomonas partagent six points d’arrêt qui sont absents des CPDNA d’Oltmannsiellopsis et de Chlorella. Il n’y a pas de point d’arrêt exclusif aux génomes d’Oltmannsiellopsis et de Chlamydomonas.
Deux grappes ancestrales présentent des points de rupture uniques aux Ulvophyceae. Le groupe psbB-psbT-psbN-psbH presque universellement conservé a été fragmenté à l’extrémité 5′ du psbN, créant deux morceaux distincts, codant chacun une paire de gènes, dans l’adNPC d’Oltmannsiellopsis. Dans la lignée des Pseudendoclonium, l’introduction d’un point de rupture supplémentaire du côté opposé du psbN a conduit à la relocalisation de ce gène sur le brin d’ADN codant pour psbB, psbT et psbH, sans aucun changement dans l’ordre des gènes. Dans la lignée Oltmannsiellopsis, trois points de rupture se sont produits dans l’opéron ancestral de l’ARNr pour générer une nouvelle unité de transcription dans laquelle l’ordre des gènes de l’ARNt (ugc) et de l’ARNt (gau) a été inversé. Des opérons d’ARNr réarrangés ont été rapportés pour les ADNC du trébouxiophyte Chlorella ellipsoidea et de l’ulvophyte Codium fragile; cependant, dans ces cas, l’opéron d’ARNr ancestral a été divisé en fragments distincts qui sont transcrits à partir de différents promoteurs.
En termes d’amas de gènes dérivés, l’ADNc d’Oltmannsiellopsis est le plus similaire à l’ADNc de Chlorella (Figure 4). Un amas dérivé est défini ici comme un groupe de gènes ayant les mêmes polarités relatives dans deux génomes UTC ou plus, mais absents des CPDNA Mesostigma et Nephroselmis. L’ADNCPT d’Oltmannsiellopsis partage cinq amas dérivés avec son homologue de Chlorella, tandis que l’ADNCPT de Pseudendoclonium partage trois amas, dont l’un est absent d’Oltmannsiellopsis. Parmi les quatre amas dérivés communs aux ADNc d’Oltmannsiellopsis et de Pseudendoclonium, aucun n’est trouvé dans l’ADNc de Chlamydomonas.
Nous avons estimé qu’un minimum de 50 inversions seraient nécessaires pour transformer l’organisation génique de l’adNPC d’Oltmannsiellopsis en celle de tout autre génome chlorophyte (tableau 6). Des analyses comparatives des ADNC provenant de plantes terrestres et de chlamydomonades étroitement apparentées suggèrent que les inversions représentent le mécanisme prédominant des réarrangements du génome des chloroplastes chez les plantes vertes. Cependant, les inversions pourraient ne pas être les seuls événements mutationnels causant des changements d’ordre génique chez les CPDNA chlorophytes, car des transpositions ont été proposées pour expliquer certains des réarrangements observés chez les Campanulacées et chez les CPDNA sous-clover.
Éléments répétés
Un grand nombre d’éléments SDR se trouvent dans l’adNPC d’Oltmannsiellopsis (Figure 5). Bien que ces éléments résident principalement dans des espaceurs et des introns intergéniques, quelques copies peuplent les régions codantes de cemA, chlB, chlL, chlN, ftsH, rpoB, rpoC1 et rpoC2. Les éléments les plus abondants peuvent être classés en cinq groupes d’unités répétées non chevauchantes (A à E) sur la base de leurs séquences primaires (tableau 7). Leur taille varie de 7 à 21 pb et leur nombre de copies varie de 17 à plus de 250. La séquence de l’unité répétée A ou B est le plus souvent liée au complément inverse de la même séquence, formant ainsi des palindromes parfaits ou des structures de tige-boucle putatives avec une boucle de deux A ou deux T (Figure 6). Dans certains cas, les palindromes ou parties de tige des structures en boucle de tige sont prolongées par l’ajout de répétitions moins fréquentes. De plus, quelques copies des unités répétées A et B se présentent comme des séquences solitaires, représentant probablement des versions dégénérées des arrangements les plus courants comportant des palindromes ou des structures en boucle de tige. L’unité de répétition C peut former des structures tige-boucle, avec une boucle de taille variable. Bien que les unités répétées D et E ne soient pas associées à des structures en boucle de tige, elles résident à proximité d’autres éléments répétés.
Les DTS de l’ADNPC d’Oltmannsiellopsis ne ressemblent pas beaucoup à ceux des autres ADNPC UTC. Les répétitions d’Oltmannsiellopsis sont biaisées en G+C, alors que les répétitions de Chlorella montrent un biais en A+T. Les DTS de Pseudendoclonium et de Chlamydomonas sont également riches en G+C, mais leurs séquences ne partagent aucune similitude évidente avec les répétitions d’Oltmannsiellopsis. Cette absence de similarités de séquence entre les DTS dérivés de génomes UTC distincts suggère que les DTS ont été acquis indépendamment dans les lignées UTC. Cependant, l’hypothèse alternative selon laquelle les DTS ont été transmis verticalement ne peut être exclue si nous supposons que ces éléments évoluent à un rythme très rapide. Des études de CPDNA de taxons UTC étroitement apparentés seront nécessaires pour distinguer ces deux hypothèses.
Les DTS ont très probablement joué un rôle majeur dans le remodelage du génome des chloroplastes dans les lignées UTC. Une corrélation a déjà été observée entre l’abondance des DTS et l’étendue des réarrangements de gènes dans les génomes d’algues UTC. Cette corrélation est toujours présente avec l’ajout de la séquence du génome d’Oltmannsiellopsis chloroplaste. L’abondance des éléments SDR dans l’adNPC d’Oltmannsiellopsis est comparable à celle observée dans l’adNPC de Pseudendoclonium (Figure 7) et les gènes ont été réarrangés dans une mesure similaire dans les deux génomes (tableau 6). Les DTS dans les CPDNA des plantes vertes pourraient servir de points chauds pour les événements recombinationnels non homologues et conduire à des inversions et des transpositions.