Die vollständige Chloroplasten-DNA-Sequenz der Grünalge Oltmannsiellopsis viridis zeigt eine ausgeprägte quadripartite Architektur im Chloroplastengenom früher divergierender Ulvophyten

Allgemeine Merkmale

Tabelle 1 vergleicht die allgemeinen Merkmale

Tabelle 1 Allgemeine Merkmale von Oltmannsiellopsis und anderen Chlorophyten-cpDNAs
Abbildung 1
 abbildung1

Genkarten von Oltmannsiellopsis und anderen Chlorophyten-cpDNAs. Gene (gefüllte Kästchen) außerhalb jeder Karte werden im Uhrzeigersinn transkribiert. Die Transkriptionsrichtung der rRNA-Gene ist durch Pfeile angedeutet. Gene, die in Gelb, blau und Rot dargestellt sind, sind den IR-, LSC- und SSC-Regionen in Mesostigma-cpDNA zugeordnet. Auf der Oltmannsiellopsis-Karte, Gene, die für die LSC-Region charakteristisch sind und sich in der Einzelkopierregion befinden, die SSC sowohl in Oltmannsiellopsis- als auch in Pseudendoclonium-cpDNAs entspricht, sind mit Sternchen gekennzeichnet. Gene, die in der Mesostigma-cpDNA fehlen, sind grau dargestellt. tRNA-Gene werden durch den einbuchstabigen Aminosäurecode gefolgt vom Anticodon in Klammern (Me, Elongator Methionin; Mf, Initiator Methionin) angezeigt. Insgesamt wurden fünf Introns (offene Boxen) identifiziert, von denen einige ORFs (schmale Boxen) aufweisen.

Gen- und Introngehalt

Der Gengehalt von Oltmannsiellopsis cpDNA liegt zwischen dem von Chlorella und Chlamydomonas cpDNAs (Tabelle 1). Obwohl Oltmannsiellopsis und Pseudendoclonium cpDNAs die gleiche Anzahl von Genen kodieren, unterscheiden sich diese Genome geringfügig in ihrem Genrepertoire (Tabelle 2). Oltmannsiellopsis cpDNA hat alle drei chl-Gene beibehalten, die in der Pseudendoclonium cpDNA fehlen, aber ycf62, trnL (caa) und trnR (ccg) verloren haben. In Bezug auf Chlorella-cpDNA fehlen den Genomen von Oltmannsiellopsis, Pseudendoclonium und Chlamydomonas ein Satz von fünf Genen, d. H. cysA, cyst und drei tRNA-Genen (trnL (gag), tRNS (gga) und trnT (ggu)) (Tabelle 2). Das Fehlen von drei Genen (ycf62, trnL (caa) und trnR (ccg)) wird eindeutig von Oltmannsiellopsis und Chlamydomonas cpDNAs geteilt, während kein spezifischer Genverlust von Pseudendoclonium und Chlamydomonas cpDNAs geteilt wird. Sowohl Oltmannsiellopsis als auch Pseudendoclonium-cpDNAs haben das trnR (ccu) -Gen beibehalten, das bei allen anderen vollständig sequenzierten Chlorophyten-cpDNAs fehlt.

Tabelle 2 Unterschiede zwischen den Genrepertoires von Oltmannsiellopsis und anderen UTC-Algen-cpDNAs

Wie in den zuvor untersuchten UTC-Chloroplastengenomen sind die kodierenden Regionen mehrerer Gene in Oltmannsiellopsis cpDNA relativ zu ihren Mesostigma-Gegenstücken erweitert (Tabelle 3). Die meisten Genexpansionen in Oltmannsiellopsis sind jedoch weniger umfangreich als in Pseudendoklonium; Nur cemA zeigt eine längere kodierende Sequenz als sein Pseudendokloniumhomolog.

Tabelle 3: Vergleich der Größe expandierter Gene in Oltmannsiellopsis und anderen UTC-Algen-cpDNAs

Unser Befund von fünf Introns der Gruppe I in der Oltmannsiellopsis-cpDNA steht in starkem Kontrast zu den 27 Introns der Gruppe I in der Pseudendoklonium-cpDNA (Tabelle 1). Die geringere Häufigkeit von Introns in Oltmannsiellopsis cpDNA erklärt hauptsächlich die geringere Größe dieses Genoms im Vergleich zu Pseudendoclonium cpDNA. Die Oltmannsiellopsis-Introns unterbrechen drei Gene (petB, psbA und rrl), die im IR gefunden wurden (Tabelle 4). Die PETB- und psbA-Gene enthalten jeweils ein Intron, während in rrl drei Introns vorhanden sind. Alle fünf Introns, mit Ausnahme des petB-Introns, sind positionell und strukturell homolog zu zuvor berichteten Introns in grünen Pflanzen-cpDNAs (Tabelle 5). Während Homologe des Oltmannsiellopsis psbA Introns in Pseudendoclonium und Chlamydomonas vorhanden sind, finden sich Homologe der drei rrl Introns in einer größeren Vielfalt von Grünpflanzen. Wenn man bedenkt, dass diese homologen Introns in UTC-Linien identifiziert wurden, könnten sie durch vertikale Vererbung vom letzten gemeinsamen Vorfahren der UTC-Algen geerbt worden sein; Die Feststellung, dass sie möglicherweise für Homing-Endonukleasen der LAGLIDADG- oder GIY-YIG-Familien kodieren (Tabelle 4), lässt jedoch nicht die Möglichkeit ausschließen, dass sie durch horizontalen Transfer erworben wurden. Obwohl die meisten der 16 Introns der Gruppe I in Pseudendoclonium cpDNA haben keine Homologen an identischen verwandten Stellen in anderen Chloroplastengenomen, Ihre engen strukturellen und Sequenzähnlichkeiten zusammen mit ihrer Abwesenheit von Oltmannsiellopsis cpDNA legen nahe, dass sie aus der intragenomischen Proliferation in der Linie entstanden sind, die zu Pseudendoclonium führt . Beachten Sie, dass die Suche der Oltmannsiellopsis petB-Intronsequenz gegen die GenBank-Datenbank kein homologes Intron in anderen Organismen nachweisen konnte.

Tabelle 4 Introns der Gruppe I in Oltmannsiellopsis cpDNA
Tabelle 5 Introns der Gruppe I an identischen Genorten in Oltmannsiellopsis-cpDNA, anderen Grünalgen-cpDNAs und Landpflanzen-cpDNAs

Genomstruktur und Genpartitionierung

Das Muster der Genpartitionierung innerhalb der Einzelkopierregionen der Oltmannsiellopsis-cpDNA unterscheidet sich erheblich von dem für Mesostigma-, Nephroselmis- und Streptophyten-cpDNAs beobachteten Muster der Ahnenpartitionierung (Abbildung 1). Die große Mehrheit der 30 Gene, die in der SC1-Region von Oltmannsiellopsis gefunden werden, sind typischerweise in der angestammten LSC-Region zu finden, während die SC2-Region 52 Gene enthält, die für die angestammte LSC-Region charakteristisch sind, zusätzlich zu zehn Genen, die für die angestammte SSC-Region charakteristisch sind. Interessanterweise enthält SC2 12 der 14 LSC-Gene, die in Pseudendoklonium-cpDNA in die SSC-Region übertragen wurden. Die beiden außergewöhnlichen Pseudendokloniumgene, die in Oltmannsiellopsis SC2 keine Homologen haben, sind trnH (gug) und trnL (caa); das trnH (gug) -Gen befindet sich in der SC1-Region von Oltmannsiellopsis, während trnL (caa) aus der Oltmannsiellopsis-cpDNA verloren gegangen ist. In Anbetracht der Gengehalte der Oltmannsiellopsis-Einzelkopierregionen erscheint es unangemessen, diese Regionen nach ihrer Größe zu kennzeichnen. Obwohl SC1 kleiner als SC2 ist, entspricht es wahrscheinlich der angestammten LSC-Region, und SC2 ist anscheinend von der angestammten SSC-Region abgeleitet.

Die IR-Sequenz in Oltmannsiellopsis cpDNA ist etwa 12 kb größer als die in Pseudendoclonium cpDNA und enthält fünf Gene zusätzlich zu denen im rRNA-Operon (Abbildung 1). Bei 18.510 bp ist die IR-Sequenz von Oltmannsiellopsis ähnlich groß wie die von Chlamydomonas (Tabelle 1). Beide IR-Übergänge in Oltmannsiellopsis cpDNA umfassen Gene (cemA und ftsH), deren kodierende Sequenzen sich in die Einzelkopierregionen ausdehnen. Wie im Pseudendoclonium IR werden die Oltmannsiellopsis rRNA-Gene in Richtung der Einzelkopierregion transkribiert, die die Gene trägt, die in Prasinophyten- und Streptophyten-cpDNAs auf die LSC abgebildet sind. Im Gegensatz dazu wird das rRNA-Operon in Richtung der SSC-Region in Nephroselmis- und Streptophyten-cpDNAs transkribiert. Die Orientierung des rRNA-Operons kann in Chlamydomonas-cpDNA aufgrund der stark verwürfelten Einzelkopierregionen nicht festgestellt werden, und diese Orientierung bleibt in Chlorella-cpDNA aufgrund des IR-Verlusts unbekannt.

In Anbetracht der Tatsache, dass Oltmannsiellopsis und Pseudendoclonium unterschiedliche, früh divergierende Linien der Ulvophyceae darstellen, legen die auffallenden Ähnlichkeiten zwischen den quadripartiten Architekturen von Oltmannsiellopsis- und Pseudendoclonium-cpDNAs nahe, dass sowohl das atypische Genpartitionierungsmuster als auch die ungewöhnliche Orientierung der IR für das Chloroplastengenom der frühesten divergierenden Ulvophyten charakteristisch waren. Unsere Daten sagen voraus, dass die SSC-Region des letzten gemeinsamen Vorfahren von Oltmannsiellopsis- und Pseudendoclonium-cpDNAs 12 der Gene enthielt, die normalerweise in der LSC-Region in Nephroselmis- und Streptophyten-CPDNAS vorkommen, während die LSC-Region ausschließlich Gene enthielt, die für die angestammte LSC-Region charakteristisch sind. Folglich wurden in der Linie, die zu Pseudendoclonium führte, zwei zusätzliche Gene in die SSC-Region übertragen, während in der Oltmannsiellopsis-Linie 40 zusätzliche Gene in diese Region migrierten. Obwohl die Mechanismen, die diesen Genmigrationen zwischen einzelnen Kopienregionen zugrunde liegen, unbekannt sind, betrafen sie wahrscheinlich intramolekulare oder intermolekulare Rekombinationsereignisse. Die unten beschriebene Analyse konservierter Gencluster zeigt deutlich, dass im Zuge dieser Migrationen mehrere Gene zusammen übertragen wurden.

Gene wurden in Chlamydomonas cpDNA umfangreicher zwischen den beiden Einzelkopierregionen gemischt (Abbildung 1). Man kann sich vorstellen, dass während der Evolution von Ulvophyten und Chlorophycean-Grünalgen das angestammte Muster der Genpartitionierung in aufeinanderfolgenden Schritten gestört wurde, wobei sich eine Pseudendoclonium-ähnliche Organisation zu einer Oltmannsiellopsis-ähnlichen Organisation entwickelte, was letztendlich zu dem umfangreichen Scrambling von Genen führte, die in Chlamydomonas beobachtet wurden. Angesichts der Abwesenheit des IR aus dem Chlorella-Genom ist es sehr schwierig festzustellen, ob sich die Transkriptionsrichtung des rRNA-Operons geändert hat und ob Gene während der Evolution von Trebouxiophyten von einer genomischen Region in eine andere verlagert wurden. Der Verlust der IR ist normalerweise mit vielen Genumlagerungen verbunden ; Im Fall von Chlorella cpDNA sind jedoch alle Gene, die normalerweise in der angestammten SSC-Region gefunden werden, mit Ausnahme von drei Genen (psaC, ycf20 und trnL (uag)) gebündelt geblieben (Abbildung 1). Untersuchungen von IR-haltigen Chloroplastengenomen aus verschiedenen Trebouxiophytenlinien werden erforderlich sein, um zu testen, ob einige der hier identifizierten Genverlagerungen sowohl in Oltmannsiellopsis- als auch in Pseudendoclonium-cpDNAs vom gemeinsamen Vorfahren der UTC-Algen stammen.

Genclustering

Die gesamte Genorganisation der Oltmannsiellopsis-cpDNA unterscheidet sich stark von der ihres Pseudendoclonium-Homologen und ähnelt überraschenderweise eher der von Chlorella-cpDNA (Abbildung 2). Oltmannsiellopsis- und Chlorella-cpDNAs teilen sich 21 Blöcke kolinearer Sequenzen, die insgesamt 65 Gene enthalten, während Oltmannsiellopsis- und Pseudendoclonium-cpDNAs 18 Blöcke mit 55 Genen gemeinsam haben. Nur acht Blöcke mit 19 Genen sind im Genom von Oltmannsiellopsis und Chlamydomonas konserviert.

Abbildung 2
 abbildung2

Gencluster, die von Oltmannsiellopsis und anderen UTC-Algen-cpDNAs gemeinsam genutzt werden. Gemeinsame Cluster werden auf der Oltmannsiellopsis-Genkarte als abwechselnde Reihe von grünen und roten Kästchen angezeigt. Gene, die sich außerhalb konservierter Cluster befinden, sind grau dargestellt. Gene, die bei Chlamydomonas, Pseudendoclonium und Chlorella fehlen, sind in Beige dargestellt. Die Ausdehnung der IR und die Transkriptionsrichtung der rRNA-Gene sind durch Pfeile gekennzeichnet. Gene außerhalb der Karte werden im Uhrzeigersinn transkribiert.

Viele der 24 Gencluster der Vorfahren, die von Mesostigma- und Nephroselmis-cpDNAs gemeinsam genutzt werden, wurden während der Evolution der UTC-Grünalgen gestört. In dieser Studie haben wir 19 Ahnencluster analysiert; die fünf verbleibenden konnten nicht untersucht werden, da die darin enthaltenen Gene aus den cpDNAs verloren gegangen sind (Abbildung 3). Alle 19 Cluster wurden während der Evolution der UTC-Algen mindestens einmal gebrochen. Mit nur 12 Haltepunkten zeigt Chlorella cpDNA die stärkste Konservierung von Ahnenclustern. Mit 20 Breakpoints belegt Oltmannsiellopsis cpDNA eine mittlere Position zwischen Chlorella- und Pseudendoclonium-cpDNAs (24 Breakpoints), während Chlamydomonas cpDNA doppelt so viele Breakpoints aufweist (42 Breakpoints). Die Chlamydomonas, Oltmannsiellopsis und Pseudendoclonium Genome teilen fünf Breakpoints, die in Chlorella cpDNA fehlen. Abgesehen von diesen Haltepunkten teilen sich Pseudendoclonium- und Chlamydomonas-cpDNAs sechs Haltepunkte, die in Oltmannsiellopsis- und Chlorella-cpDNAs fehlen. Es gibt keinen Haltepunkt exklusiv für die Oltmannsiellopsis und Chlamydomonas Genome.

Abbildung 3
 abbildung3

Fragmentierte Ahnengencluster in den cpDNAs von UTC-Algen. Die angegebenen Cluster finden sich sowohl in Mesostigma- als auch in Nephroselmis-cpDNAs. Beachten Sie, dass rpl22 nicht im großen ribosomalen Proteincluster vertreten ist, da es nur in Mesostigma-cpDNA (zwischen rps19 und rps3) vorhanden ist. Fragmentierungsstellen werden durch Pfeilspitzen verschiedener Schattierungen über den Clustern gekennzeichnet: Chlamydomonas, gefüllte Pfeilspitzen; Pseudendoclonium, dunkelgraue Pfeilspitzen; Oltmannsiellopsis, hellgraue Pfeilspitzen; und Chlorella, offene Pfeilspitzen. Gene, die in Chlamydomonas, Pseudendoclonium, Oltmannsiellopsis und Chlorella fehlen, werden durch Quadrate, Kreise, Sternchen bzw. Genpolaritäten sind nicht dargestellt.

Zwei Ahnencluster zeigen Haltepunkte an, die für die Ulvophyceae einzigartig sind. Der fast universell konservierte PSBB-psbT-psbN-psbH-Cluster wurde am 5′-Ende von PSBN fragmentiert, wodurch in Oltmannsiellopsis cpDNA zwei separate Stücke entstanden, die jeweils für ein Genpaar kodieren. In der Pseudendoklonium-Linie führte die Einführung eines zusätzlichen Haltepunkts auf der gegenüberliegenden Seite von psbN zur Verlagerung dieses Gens auf den DNA-Strang, der für psbB, psbT und psbH kodiert, ohne dass sich die Genreihenfolge änderte. In der Oltmannsiellopsis-Linie traten drei Haltepunkte im angestammten rRNA-Operon auf, um eine neue Transkriptionseinheit zu erzeugen, in der die Reihenfolge der tRNA- (ugc) und trnI- (gau) Gene umgekehrt wurde. Für die cpDNAs des Trebouxiophyten Chlorella ellipsoidea und des Ulvophyten Codium fragile wurden neu angeordnete rRNA-Operone berichtet ; In diesen Fällen wurde jedoch das angestammte rRNA-Operon in separate Fragmente aufgeteilt, die von verschiedenen Promotoren transkribiert werden.

In Bezug auf abgeleitete Gencluster ist die Oltmannsiellopsis-cpDNA der Chlorella-cpDNA am ähnlichsten (Abbildung 4). Ein abgeleiteter Cluster ist hier definiert als eine Gruppe von Genen mit den gleichen relativen Polaritäten in zwei oder mehr UTC-Genomen, die jedoch in Mesostigma- und Nephroselmis-cpDNAs fehlen. Oltmannsiellopsis cpDNA teilt fünf abgeleitete Cluster mit seinem Chlorella-Homolog, während Pseudendoclonium cpDNA drei Cluster teilt, von denen einer in Oltmannsiellopsis fehlt. Von den vier abgeleiteten Clustern, die Oltmannsiellopsis und Pseudendoclonium cpDNAs gemeinsam sind, wird keiner in Chlamydomonas cpDNA gefunden.

Abbildung 4
 abbildung4

Abgeleitete Gencluster, die von den cpDNAs der Algen gemeinsam genutzt werden. Gefüllte / offene Kästchen stellen das Vorhandensein / Fehlen von Clustern dar. Genpolaritäten sind nicht dargestellt.

Wir schätzten, dass mindestens 50 Inversionen erforderlich wären, um die Genorganisation von Oltmannsiellopsis cpDNA in die eines anderen Chlorophytengenoms umzuwandeln (Tabelle 6). Vergleichende Analysen von cpDNAs von Landpflanzen und von eng verwandten Chlamydomonaden legen nahe, dass Inversionen den vorherrschenden Mechanismus der Chloroplastengenomumlagerungen in Grünpflanzen darstellen. Inversionen könnten jedoch nicht die einzigen Mutationsereignisse sein, die Genordnungsänderungen in Chlorophyten-cpDNAs verursachen, da Transpositionen vorgeschlagen wurden, um einige der in Campanulaceae und in Subkulturen beobachteten Umlagerungen zu erklären cpDNAs.

Tabelle 6: Minimale Anzahl von Inversionen, die Genumlagerungen zwischen Grünalgen-cpDNAs erklären

Wiederholte Elemente

Eine große Anzahl von SDR-Elementen findet sich in Oltmannsiellopsis cpDNA (Abbildung 5). Obwohl sich diese Elemente überwiegend in intergenen Spacern und Introns befinden, bevölkern einige Kopien die kodierenden Regionen von cemA, chlB, chlL, chlN, ftsH, rpoB, rpoC1 und rpoC2. Die am häufigsten vorkommenden Elemente können anhand ihrer Primärsequenzen in fünf Gruppen nicht überlappender Wiederholungseinheiten (A bis E) eingeteilt werden (Tabelle 7). Ihre Größen reichen von 7-21 bp und ihre Kopienzahlen variieren von 17 bis mehr als 250. Die Sequenz der Wiederholungseinheit A oder B ist meistens mit dem umgekehrten Komplement derselben Sequenz verbunden, wodurch perfekte Palindrome oder mutmaßliche Stammschleifenstrukturen mit einer Schleife von zwei A oder zwei T gebildet werden (Abbildung 6). In einigen Fällen werden die Palindrome oder Stammabschnitte der Stammschleifenstrukturen durch Hinzufügen weniger häufiger Wiederholungen erweitert. Darüber hinaus treten einige Kopien der Wiederholungseinheiten A und B als solitäre Sequenzen auf, die wahrscheinlich degenerierte Versionen der häufigeren Anordnungen mit Palindromen oder Stammschleifenstrukturen darstellen. Die Wiederholeinheit C kann Stammschleifenstrukturen mit einer Schleife variabler Größe bilden. Obwohl Wiederholungseinheiten D und E nicht mit Stammschleifenstrukturen assoziiert sind, befinden sie sich in der Nähe anderer wiederholter Elemente.

Abbildung 5
 abbildung5

Positionen von SDR-Elementen in Oltmannsiellopsis cpDNA. Die Oltmannsiellopsis-cpDNA-Sequenz wurde mit PipEtten gegen sich selbst ausgerichtet. Regionen, die SDRs enthalten, können als Punktcluster identifiziert werden. Ähnlichkeiten zwischen ausgerichteten Regionen werden als durchschnittliche prozentuale Identität (zwischen 50 und 100% Identität) angezeigt. Gene und ihre Polaritäten sind durch horizontale Pfeile gekennzeichnet und kodierende Sequenzen werden durch gefüllte Kästchen dargestellt.

Tabelle 7 SZR-Einheiten in Oltmannsiellopsis cpDNA
Abbildung 6
 abbildung6

Vorhergesagte Sekundärstrukturen gebildet durch SDR-Einheiten A und B in Oltmannsiellopsis cpDNA.

Die SDRs in Oltmannsiellopsis cpDNA ähneln nicht sehr denen in anderen UTC cpDNAs. Die Oltmannsiellopsis-Wiederholungen sind in G + C voreingenommen, während die Chlorella-Wiederholungen in A + T voreingenommen sind. Die Pseudendoclonium- und Chlamydomonas-SDRs sind ebenfalls reich an G + C, aber ihre Sequenzen haben keine offensichtlichen Ähnlichkeiten mit den Oltmannsiellopsis-Wiederholungen. Dieser Mangel an Sequenzähnlichkeiten zwischen SDRs, die aus verschiedenen UTC-Genomen stammen, legt nahe, dass SDRs unabhängig voneinander in UTC-Linien erworben wurden. Die alternative Hypothese, dass SZR vertikal übertragen wurden, kann jedoch nicht ausgeschlossen werden, wenn wir davon ausgehen, dass sich diese Elemente sehr schnell entwickeln. Studien von cpDNAs aus eng verwandten UTC-Taxa sind erforderlich, um zwischen diesen beiden Hypothesen zu unterscheiden.

SDRs haben höchstwahrscheinlich eine wichtige Rolle bei der Remodellierung des Chloroplastengenoms in UTC-Linien gespielt. Zuvor wurde eine Korrelation zwischen der Häufigkeit von SDRs und dem Ausmaß der Genumlagerungen in den Algengenomen beobachtet . Diese Korrelation gilt noch mit der Zugabe von Oltmannsiellopsis Chloroplasten Genomsequenz. Die Häufigkeit von SDR-Elementen in Oltmannsiellopsis cpDNA ist vergleichbar mit der in Pseudendoclonium cpDNA beobachteten (Abbildung 7) und Gene wurden in beiden Genomen in ähnlichem Maße neu angeordnet (Tabelle 6). SDRs in grünen Pflanzen-cpDNAs könnten als Hot Spots für nicht-homologe Rekombinationsereignisse dienen und zu Inversionen und Transpositionen führen .

Abbildung 7
 abbildung7

Dichten von SDR-Elementen in Oltmannsiellopsis und anderen Chlorophyten-cpDNAs, wie von REPuter aufgedeckt. Wiederholte Elemente mit identischen Sequenzen sind auf den kreisförmigen Darstellungen der Genome verbunden. Wiederholungen größer als 30 bp und 45 bp werden auf der oberen bzw. unteren Platte angezeigt. Für diese Analysen wurde eine Kopie der IR-Sequenz aus den Genomen Nephroselmis, Pseudendoclonium, Oltmannsiellopsis und Chlamydomonas deletiert.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht.