den fullständiga kloroplast-DNA-sekvensen för den gröna algen Oltmannsiellopsis viridis avslöjar en distinkt quadripartite-arkitektur i kloroplastgenomet av tidiga divergerande ulvophytes

Allmänna egenskaper

Tabell 1 jämför de allmänna egenskaperna hos oltmannsiellopsis cpdna med de fyra klorofyt cpdnas fullständigt sekvenserade hittills, dvs. genomerna av Nephroselmis , Chlorella, Pseudoklonium och Chlamydomonas . Vid 59,5% liknar det totala a+T-innehållet i Oltmannsiellopsis cpDNA det för Nephroselmis cpDNA men är signifikant lägre än de tre tidigare sekvenserade UTC-genomerna. Oltmannsiellopsis genom kartlägger som en cirkulär molekyl av 151,933 bp (Figur 1) och innehåller 105 gener. Två kopior av en IR-sekvens på 18 510 bp, var och en kodar för tio gener, separeras från varandra genom ojämna enstaka kopieringsregioner, betecknade SC1 och SC2. Liksom andra UTC-cpDNAs är Oltmannsiellopsis-genomet mindre tätt packat med kodande sekvenser än Mesostigma och Nephroselmis cpDNAs; vid 59,2% liknar dess densitet av kodande sekvenser de för klorella och Pseudendoclonium cpDNAs. Intergena distanser i Oltmannsiellopsis cpDNA har SDR och har en genomsnittlig storlek på 512 bp, ett värde jämförbart med det som observerats för Pseudendoclonium cpDNA (600 bp). Totalt fem introner, som alla tillhör grupp i-familjen, identifierades i Oltmannsiellopsis cpDNA.

Tabell 1 Allmänna egenskaper hos Oltmannsiellopsis och andra klorofyt cpDNAs
Figur 1
figur1

Gen kartor över Oltmannsiellopsis och andra klorofyt cpDNAs. Gener (fyllda lådor) utanför varje karta transkriberas medurs. Transkriptionsriktningen för rRNA-generna indikeras med pilar. Gener som visas i gul, blå och röd karta till IR, LSC och SSC regioner i Mesostigma cpDNA, respektive. På Oltmannsiellopsis-kartan betecknas gener som är karakteristiska för LSC-regionen som finns i den enda kopieringsregionen som motsvarar SSC i både Oltmannsiellopsis och Pseudendoclonium cpDNAs med asterisker. Gener som saknas från Mesostigma cpDNA visas i grått. tRNA-gener indikeras av aminosyrakoden med en bokstav följt av antikodon inom parentes (Me, elongator metionin; Mf, initiator metionin). Totalt identifierades fem introner (öppna lådor), varav några har ORFs (smala lådor).

gen-och intron-innehåll

geninnehållet i Oltmannsiellopsis cpDNA är mellanliggande mellan de av Chlorella och Chlamydomonas cpDNAs (Tabell 1). Även om Oltmannsiellopsis och Pseudendoclonium cpDNAs kodar för samma antal gener, skiljer sig dessa genom något i deras genrepertoar (Tabell 2). Oltmannsiellopsis cpDNA har behållit alla tre chl-gener som saknas från Pseudendoclonium cpDNA men har förlorat ycf62, trnL(caa) och trnR(ccg). I förhållande till Chlorella cpdna saknar genomerna av Oltmannsiellopsis, Pseudendoclonium och Chlamydomonas en uppsättning av fem gener, dvs cysA, cyste och tre tRNA-gener (trnL(gag), trnS(gga) och trnT(GGU)) (Tabell 2). Frånvaron av tre gener (ycf62, trnL(caa) och trnR(ccg)) delas unikt av Oltmannsiellopsis och Chlamydomonas cpDNAs, medan ingen specifik genförlust delas av Pseudendoclonium och Chlamydomonas cpDNAs. Både Oltmannsiellopsis och Pseudendoclonium cpDNAs har behållit trnR-genen(ccu), som saknas från alla andra fullständigt sekvenserade klorofyt-cpDNAs.

Tabell 2 skillnader mellan Genrepertoiren hos Oltmannsiellopsis och andra UTC-alger cpDNAs

som i UTC-kloroplastgenom som tidigare undersökts expanderas de kodande regionerna för flera gener i Oltmannsiellopsis cpDNA i förhållande till deras Mesostigma motsvarigheter (tabell 3). De flesta av genutvidgningarna i Oltmannsiellopsis är dock mindre omfattande än de i Pseudendoclonium; endast cemA visar en längre kodande sekvens än dess Pseudendoclonium-homolog.

tabell 3 jämförda storlekar av expanderade gener i Oltmannsiellopsis och andra UTC-alger cpDNAs

vårt resultat av fem grupp i-introner i Oltmannsiellopsis cpDNA kontrasterar kraftigt med de 27 grupp i-introner som finns i Pseudendoclonium cpDNA (Tabell 1). Det lägre överflödet av introner i Oltmannsiellopsis cpDNA står huvudsakligen för den mindre storleken på detta genom i förhållande till Pseudendoclonium cpDNA. Oltmannsiellopsis-intronerna avbryter tre gener (petB, psbA och rrl) som finns i IR (Tabell 4). PetB-och psbA-generna innehåller vardera en intron, medan tre introner finns i rrl. Alla fem introner, med undantag för petB-intron, är positionellt och strukturellt homologa med tidigare rapporterade introner i grön växt cpDNAs (Tabell 5). Medan homologer av Oltmannsiellopsis psbA intron finns i Pseudendoclonium och Chlamydomonas, homologer av de tre RRL introns finns i en större mångfald av gröna växter. Med tanke på att dessa homologa introner har identifierats i UTC-linjer, kunde de ha ärvts av vertikalt arv från den sista gemensamma förfadern till UTC-alger; men upptäckten att de potentiellt kodar för homing endonukleaser av LAGLIDADG-eller GIY-YIG-familjerna (Tabell 4) tillåter oss inte att utesluta möjligheten att de förvärvades genom horisontell överföring. Även om de flesta av 16 grupp i introner i Pseudendoclonium cpDNA har inga homologer på identiska besläktade ställen i andra kloroplastgenomer, deras nära strukturella och sekvenslikheter tillsammans med deras frånvaro från Oltmannsiellopsis cpDNA tyder på att de uppstod från intragenomisk proliferation i härstamning leder till Pseudendoclonium . Observera att Sprängsökningar av Oltmannsiellopsis petB intron-sekvensen mot GenBank-databasen misslyckades med att upptäcka någon homolog intron i andra organismer.

Tabell 4 grupp i introner i Oltmannsiellopsis cpDNA
Tabell 5 grupp i introner på identiska genplatser i Oltmannsiellopsis cpDNA, andra gröna alger cpDNAs och landväxter cpDNAs

Genomstruktur och genpartitionering

mönstret för genpartitionering inom de enskilda kopieringsregionerna av Oltmannsiellopsis cpDNA skiljer sig väsentligt från det förfaderliga partitioneringsmönstret som observerats för Mesostigma, Nephroselmis och streptofyt cpDNAs (Figur 1). Den stora majoriteten av de 30 gener som finns i SC1-regionen i Oltmannsiellopsis finns vanligtvis i förfädernas LSC-region, medan SC2-regionen innehåller 52 gener som är karakteristiska för förfädernas LSC-region förutom tio gener som är karakteristiska för förfädernas SSC-region. Intressant innehåller SC2 12 av de 14 LSC-generna som har överförts till SSC-regionen i Pseudendoclonium cpDNA. De två exceptionella Pseudendokloniumgenerna som inte har några homologer i Oltmannsiellopsis SC2 är trnH (gug) och trnL (caa); trnH(gug) – genen finns i SC1-regionen Oltmannsiellopsis, medan trnL (caa) har gått vilse från Oltmannsiellopsis cpDNA. Med tanke på geninnehållet i Oltmannsiellopsis enstaka kopieringsregioner verkar det olämpligt att märka dessa regioner enligt deras storlekar. Även om SC1 är mindre än SC2, motsvarar det sannolikt förfädernas LSC-region, och SC2 är uppenbarligen härledd från förfädernas SSC-region.

IR-sekvensen i Oltmannsiellopsis cpDNA är cirka 12 kb större än den i Pseudendoclonium cpDNA och innehåller fem gener utöver de som finns i rRNA-operonen (Figur 1). Vid 18 510 bp är IR-sekvensen av Oltmannsiellopsis liknande i storlek som den för Chlamydomonas (Tabell 1). Båda IR-korsningar i Oltmannsiellopsis cpDNA omfattar gener (cemA och ftsH) av vilka de kodande sekvenserna expanderar till de enskilda kopieringsregionerna. Som i Pseudendoclonium IR transkriberas Oltmannsiellopsis rRNA-generna mot den enda kopieringsregionen som bär generna som kartlägger till LSC i prasinophyte och streptophyte cpDNAs. Däremot transkriberas rRNA-operonen mot SSC-regionen i Nephroselmis och streptophyte cpDNAs. Orienteringen av rRNA-operonen kan inte fastställas i Chlamydomonas cpDNA på grund av de omfattande kodade enstaka kopieringsregionerna, och denna orientering förblir okänd i Chlorella cpDNA på grund av IR-förlusten.

med tanke på att Oltmannsiellopsis och Pseudendoclonium representerar distinkta, tidigt divergerande linjer av Ulvophyceae, de slående likheterna mellan quadripartite arkitekturer av Oltmannsiellopsis och Pseudendoclonium cpDNAs tyder på att både atypiska genpartitionering mönster och ovanlig orientering av IR var karakteristiska för kloroplastgenomet av tidigast divergerande ulvophytes. Våra data förutspår att SSC-regionen i den sista gemensamma förfadern till Oltmannsiellopsis och Pseudendoclonium cpDNAs innehöll 12 av generna som vanligtvis finns i LSC-regionen i Nephroselmis och streptophyte cpDNAs, medan LSC-regionen uteslutande innehöll gener som är karakteristiska för förfädernas LSC-region. Följaktligen, i härstamning som leder till Pseudendoclonium, två extra gener överfördes till SSC regionen, medan 40 ytterligare gener migrerade till denna region i Oltmannsiellopsis härstamning. Även om mekanismerna bakom dessa genmigrationer mellan enstaka kopieringsregioner förblir okända, involverade de förmodligen intramolekylära eller intermolekylära rekombinationshändelser. Analysen av konserverade genkluster som rapporteras nedan indikerar tydligt att flera gener överfördes tillsammans under dessa migrationer.

gener har blivit mer omfattande blandade mellan de två enstaka kopiorna i Chlamydomonas cpDNA (Figur 1). Det kan förutses att under utvecklingen av ulvofyter och klorofycean gröna alger, förfädernas mönster av genpartitionering stördes i successiva steg, med en Pseudokloniumliknande organisation som utvecklades till en Oltmannsiellopsis-liknande organisation, vilket i slutändan leder till den omfattande förvrängningen av gener som observerats i Chlamydomonas. Med tanke på frånvaron av IR från Chlorella-genomet är det mycket svårt att fastställa om transkriptionsriktningen för rRNA-operonen förändrades och om gener flyttades från en genomregion till en annan under utvecklingen av trebouxiophytes. Förlust av IR är vanligtvis förknippad med många genarrangemang ; i fallet med Chlorella cpDNA har emellertid alla gener som vanligtvis finns i förfädernas SSC-region förblivit grupperade, med undantag för tre gener (psaC, ycf20 och trnL(uag)) (Figur 1). Undersökningar av IR-innehållande kloroplastgenom från distinkta trebouxiophyte-linjer kommer att krävas för att testa om några av genförflyttningarna som identifierats här i både Oltmannsiellopsis och Pseudendoclonium cpDNAs härstammar från den gemensamma förfadern till UTC-alger.

genklustring

den övergripande genorganisationen för Oltmannsiellopsis cpDNA skiljer sig mycket från den för dess Pseudendoclonium-homolog och liknar överraskande mer den för Chlorella cpDNA (Figur 2). Oltmannsiellopsis och Chlorella cpdnas delar 21 block av kolinjära sekvenser som innehåller totalt 65 gener, medan Oltmannsiellopsis och Pseudendoclonium cpDNAs har gemensamt 18 block innehållande 55 gener. Endast åtta block innehållande 19 gener bevaras i Oltmannsiellopsis och Chlamydomonas genom.

Figur 2
figur2

genkluster delade mellan Oltmannsiellopsis och andra UTC-alger cpDNAs. Delade kluster visas på Oltmannsiellopsis – genkartan som alternerande serier av gröna och röda rutor. Gener som ligger utanför konserverade kluster visas i grått. Gener som saknas från Chlamydomonas, Pseudendoclonium och Chlorella är representerade i beige. Omfattningen av IR-och transkriptionsriktningen för rRNA-generna betecknas med pilar. Gener utanför kartan transkriberas medurs.

många av de 24 förfädernas genkluster som delas av Mesostigma och Nephroselmis cpDNAs har störts under utvecklingen av UTC-gröna alger. I denna studie har vi analyserat 19 förfäderskluster; de fem återstående kunde inte undersökas eftersom generna de innehåller har gått förlorade från UTC cpDNAs (Figur 3). Alla 19 kluster har brutits åtminstone vid ett tillfälle under utvecklingen av UTC-algerna. Med endast 12 brytpunkter visar Chlorella cpDNA den starkaste bevarandet av förfädernas kluster. Med 20 brytpunkter upptar Oltmannsiellopsis cpDNA en medianposition mellan Chlorella och Pseudendoclonium (24 brytpunkter) cpDNAs, medan Chlamydomonas cpdna avslöjar dubbelt så många brytpunkter (42 brytpunkter). Chlamydomonas, Oltmannsiellopsis och Pseudendoclonium genomer delar fem brytpunkter som saknas i Chlorella cpDNA. Bortsett från dessa brytpunkter, Pseudendoclonium och Chlamydomonas cpdnas delar sex brytpunkter som saknas från Oltmannsiellopsis och Chlorella cpDNAs. Det finns ingen Brytpunkt exklusiv för Oltmannsiellopsis och Chlamydomonas genom.

Figur 3
figur3

fragmenterade förfädernas genkluster i cpDNAs av UTC-alger. De angivna klusterna finns i både Mesostigma och Nephroselmis cpDNAs. Observera att rpl22 inte har representerats i det stora ribosomala proteinklustret eftersom det endast finns i Mesostigma cpDNA (mellan rps19 och rps3). Platser av fragmentering betecknas med pilspetsar av olika nyanser ovanför klusterna: Chlamydomonas, fyllda pilhuvud; Pseudendoklonium, mörkgrå pilhuvud; Oltmannsiellopsis, ljusgrå pilhuvud; och klorella, öppna pilhuvud. Gener som saknas från Chlamydomonas, Pseudendoclonium, Oltmannsiellopsis och Chlorella indikeras av kvadrater, cirklar, asterisker respektive dubbel dolk. Genpolariteter visas inte.

två förfäderskluster visar brytpunkter som är unika för Ulvophyceae. Det nästan universellt konserverade psbb-psbT-psbN-psbH-klustret fragmenterades vid 5′ – änden av psbN och skapade två separata bitar, var och en kodar för ett par gener, i Oltmannsiellopsis cpDNA. I Pseudendokloniumlinjen ledde introduktionen av en ytterligare Brytpunkt på motsatt sida av psbN till omlokaliseringen av denna gen på DNA-strängen som kodar för psbB, psbT och psbH, utan någon förändring i genordning. I Oltmannsiellopsis-linjen inträffade tre brytpunkter i förfädernas rRNA-operon för att generera en ny transkriptionsenhet där ordningen för trnA(ugc) och trnI(gau) gener har vänts. Omarrangerade rRNA-operoner har rapporterats för cpDNAs av trebouxiophyte Chlorella ellipsoidea och ulvophyte Codium fragile ; i dessa fall delades dock förfädernas rRNA-operon i separata fragment som transkriberas från olika promotorer.

när det gäller härledda genkluster är Oltmannsiellopsis cpDNA mest lik Chlorella cpDNA (Figur 4). Ett härledt kluster definieras här som en grupp gener med samma relativa polariteter i två eller flera UTC-genom, men frånvarande från Mesostigma och Nephroselmis cpDNAs. Oltmannsiellopsis cpdna delar fem härledda kluster med sin Chlorella homolog, medan Pseudendoclonium cpDNA delar tre kluster, varav en saknas i Oltmannsiellopsis. Av de fyra härledda kluster som är gemensamma för Oltmannsiellopsis och Pseudendoclonium cpDNAs finns ingen i Chlamydomonas cpDNA.

Figur 4
figur4

härledda genkluster delade mellan cpDNAs av UTC-alger. Fyllda / öppna lådor representerar närvaron / frånvaron av kluster. Genpolariteter visas inte.

vi uppskattade att minst 50 inversioner skulle krävas för att omvandla genorganisationen för Oltmannsiellopsis cpDNA till något annat klorofytgenom (Tabell 6). Jämförande analyser av cpDNAs från landväxter och från närbesläktade chlamydomonader tyder på att inversioner representerar den dominerande mekanismen för kloroplastgenomarrangemang i gröna växter. Inversioner kan dock inte vara de enda mutationshändelser som orsakar genorderförändringar i klorofyter cpDNAs, eftersom transpositioner har föreslagits för att redogöra för några av de omarrangemang som observerats i Campanulaceae och i subclover cpDNAs.

Tabell 6 minimalt antal inversioner som står för genomläggningar mellan cpdnaer med grönalg

upprepade element

ett stort antal SDR-element finns i Oltmannsiellopsis cpDNA (Figur 5). Även om dessa element huvudsakligen finns inom intergena distanser och introner, fyller några kopior de kodande regionerna cemA, chlB, chlL, chlN, ftsH, rpoB, rpoC1 och rpoC2. De vanligaste elementen kan klassificeras i fem grupper av icke-överlappande upprepningsenheter (A till E) på grundval av deras primära sekvenser (Tabell 7). Deras storlekar sträcker sig från 7-21 bp och deras kopianummer varierar från 17 till mer än 250. Sekvensen av repetitionsenhet A eller B är oftast kopplad till det omvända komplementet av samma sekvens, vilket bildar perfekta palindrom eller förmodade stamslingstrukturer med en slinga av två A eller två T (Figur 6). I vissa fall förlängs palindromerna eller stamdelarna av stam-slingstrukturerna genom tillsats av mindre frekventa upprepningar. Vidare förekommer några kopior av upprepade enheter A och B som ensamma sekvenser, som förmodligen representerar degenererade versioner av de vanligaste arrangemangen med palindrom eller stamslinga strukturer. Upprepa enhet C kan bilda stam-loop strukturer, med en slinga av variabel storlek. Även om upprepade enheter D och E inte är associerade med stamslingstrukturer, bor de i närheten av andra upprepade element.

Figur 5
figur5

positioner för SDR-element i Oltmannsiellopsis cpDNA. Oltmannsiellopsis cpDNA-sekvensen justerades mot sig själv med hjälp av PipMaker. Regioner som innehåller SDR kan identifieras som kluster av prickar. Likheter mellan inriktade regioner visas som Genomsnittlig procentuell identitet (mellan 50 och 100% identitet). Gener och deras polariteter betecknas med horisontella pilar och kodande sekvenser representeras av fyllda lådor.

Tabell 7 SDR-enheter i Oltmannsiellopsis cpDNA
Figur 6
figur6

förutsagda sekundära strukturer bildade av SDR-enheter A och B i Oltmannsiellopsis cpDNA.

SDR i Oltmannsiellopsis cpDNA liknar inte nära de som finns i andra UTC cpdna. Oltmannsiellopsis-upprepningarna är förspända i G + C, medan Chlorella-upprepningarna visar en förspänning i A+T. Pseudoklonium och Chlamydomonas SDR är också rika på G+C, men deras sekvenser delar inga uppenbara likheter med Oltmannsiellopsis-upprepningarna. Denna brist på sekvenslikheter mellan SDR härledda från distinkta UTC-genom tyder på att SDR har förvärvats oberoende i UTC-linjer. Den alternativa hypotesen att SDR överfördes vertikalt kan emellertid inte uteslutas om vi antar att dessa element utvecklas i mycket snabb takt. Studier av cpDNAs från närbesläktade UTC taxa kommer att krävas för att skilja mellan dessa två hypoteser.

SDR har troligen spelat en viktig roll vid ombyggnad av kloroplastgenomet i UTC-linjer. En korrelation har tidigare observerats mellan överflödet av SDR och omfattningen av genomarrangemang i UTC-alggenom . Denna korrelation håller fortfarande med tillsatsen av Oltmannsiellopsis kloroplastgenomsekvens. Överflödet av SDR-element i Oltmannsiellopsis cpDNA är jämförbart med det som observerats i Pseudendoclonium cpDNA (Figur 7) och gener har omorganiserats i liknande utsträckning i båda genomerna (Tabell 6). Sdr i gröna växter cpDNAs kan fungera som hotspots för icke-homologa rekombinationella händelser och leda till inversioner och transpositioner .

Figur 7
figur7

densiteter av SDR-element i Oltmannsiellopsis och andra klorofyt cpDNAs som avslöjats av REPuter. Upprepade element med identiska sekvenser är anslutna på genomens cirkulära representationer. Upprepningar större än 30 bp och 45 bp visas på respektive övre och nedre paneler. För dessa analyser togs en kopia av IR-sekvensen bort från Nephroselmis, Pseudendoclonium, Oltmannsiellopsis och Chlamydomonas genom.

Lämna ett svar

Din e-postadress kommer inte publiceras.