den komplette chloroplast-DNA-sekvens af den grønne alge Oltmannsiellopsis viridis afslører en markant firepartsarkitektur i chloroplastgenomet af tidlige divergerende ulvofytter

generelle træk

tabel 1 sammenligner den generelle funktioner af oltmannsiellopsis cpDNA med dem af de fire Chlorophyte cpDNA ‘ er fuldstændigt sekventeret hidtil, dvs. genomerne af Nephroselmis , Chlorella, Pseudendoclonium og Chlamydomonas . Ved 59,5% svarer det samlede A+T-indhold af Oltmannsiellopsis cpDNA til det for Nephroselmis cpDNA, men er signifikant lavere end for de tre tidligere sekventerede UTC-genomer. Oltmannsiellopsis-genomet kortlægges som et cirkulært molekyle på 151.933 bp (Figur 1) og indeholder 105 gener. To kopier af en IR-sekvens på 18.510 bp, der hver koder for ti gener, adskilles fra hinanden af ulige enkeltkopierede regioner, betegnet SC1 og SC2. Ligesom andre UTC cpDNA ‘er er Oltmannsiellopsis-genomet mindre tæt pakket med kodende sekvenser end Mesostigma og Nephroselmis cpDNA’ er; ved 59,2% svarer dens densitet af kodende sekvenser til dem af Chlorella og Pseudendoclonium cpDNA ‘ er. Intergeniske afstandsstykker i Oltmannsiellopsis cpDNA har SDR ‘ er og har en gennemsnitlig størrelse på 512 bp, en værdi, der kan sammenlignes med den, der observeres for Pseudendoclonium cpDNA (600 bp). I alt fem introner, som alle tilhører gruppe i-familien, blev identificeret i Oltmannsiellopsis cpDNA.

tabel 1 generelle træk ved Oltmannsiellopsis og andre chlorophyte-cpDNA ‘er
Figur 1
figur1

Gen kort over Oltmannsiellopsis og andre chlorophyte cpDNA’ er. Gener (fyldte kasser) uden for hvert kort transskriberes med uret. Transkriptionsretningen af rRNA-generne er angivet med pile. Gener vist i gul, blå og rød kort til IR, LSC og SSC regioner i Mesostigma cpDNA, henholdsvis. På Oltmannsiellopsis-kortet er gener, der er karakteristiske for LSC-regionen, der befinder sig i den enkelte kopiregion, der svarer til SSC i både Oltmannsiellopsis og Pseudendoclonium cpDNA ‘ er, betegnet med stjerner. Gener fraværende fra Mesostigma cpDNA er vist i gråt. tRNA-gener er angivet med aminosyrekoden med et bogstav efterfulgt af anticodon i parentes (Me, elongator methionin; Mf, initiator methionin). I alt fem introner (åbne kasser) blev identificeret, hvoraf nogle har ORFs (smalle kasser).

gen-og intronindhold

genindholdet i Oltmannsiellopsis cpDNA er mellemliggende mellem indholdet af Chlorella og Chlamydomonas cpDNA ‘ er (Tabel 1). Selvom Oltmannsiellopsis og Pseudendoclonium cpDNA ‘ er koder for det samme antal gener, adskiller disse genomer sig lidt i deres genrepertoire (tabel 2). Oltmannsiellopsis cpDNA har bevaret alle tre chl-gener, der mangler fra Pseudendoclonium cpDNA, men har mistet ycf62, trnL(caa) og trnR(ccg). I forhold til Chlorella cpDNA mangler genomerne af Oltmannsiellopsis, Pseudendoclonium og Chlamydomonas et sæt på fem gener, dvs.cysA, cyste og tre tRNA-gener (trnL(gag), trnS(gga) og trnT(ggu)) (tabel 2). Fraværet af tre gener (ycf62, trnL(caa) og trnR(ccg)) deles unikt af Oltmannsiellopsis og Chlamydomonas cpDNA ‘er, mens intet specifikt gentab deles af Pseudendoclonium og Chlamydomonas cpDNA’ er. Både Oltmannsiellopsis og Pseudendoclonium cpDNA ‘er har bevaret trnR(ccu) genet, som er fraværende fra alle andre fuldstændigt sekventerede chlorophyte cpDNA’ er.

tabel 2 forskelle mellem genrepertoirerne for Oltmannsiellopsis og andre UTC-alger cpDNA ‘ er

som i de tidligere undersøgte UTC-chloroplastgenomer udvides de kodende regioner for flere gener i Oltmannsiellopsis cpDNA i forhold til deres Mesostigma-modstykker (tabel 3). Imidlertid er de fleste af genudvidelserne i Oltmannsiellopsis mindre omfattende end dem i Pseudendoclonium; kun cemA viser en længere kodende sekvens end dens Pseudendocloniumhomolog.

tabel 3 sammenlignede størrelser af ekspanderede gener i Oltmannsiellopsis og andre UTC-alger cpDNA ‘ er

vores fund af fem gruppe i-introner i Oltmannsiellopsis cpDNA står i skarp kontrast til de 27 gruppe i-introner, der findes i Pseudendoclonium cpDNA (tabel 1). Den lavere overflod af introner i Oltmannsiellopsis cpDNA tegner sig hovedsageligt for den mindre størrelse af dette genom i forhold til Pseudendoclonium cpDNA. Oltmannsiellopsis-intronerne afbryder tre gener (petB, psbA og rrl), der findes i IR (Tabel 4). PetB-og psbA-generne indeholder hver en intron, mens tre introner er til stede i rrl. Alle fem introner, med undtagelse af petB-intronen, er positionelt og strukturelt homologe med tidligere rapporterede introner i grønne plante-cpDNA ‘ er (Tabel 5). Mens homologer af Oltmannsiellopsis psbA intron er til stede i Pseudendoclonium og Chlamydomonas, findes homologer af de tre RRL-introner i en større mangfoldighed af grønne planter. I betragtning af at disse homologe introner er blevet identificeret i UTC-slægter, kunne de have været arvet ved lodret arv fra den sidste fælles forfader til UTC-alger; konstateringen af, at de potentielt koder for homing endonukleaser af laglidadg-eller GIY-YIG-familierne (Tabel 4), tillader os imidlertid ikke at udelukke muligheden for, at de blev erhvervet ved vandret overførsel. Selvom det meste af 16 gruppe i-introner i Pseudendoclonium cpDNA har ingen homologer på identiske beslægtede steder i andre chloroplastgenomer, deres tætte strukturelle og sekvenslignende ligheder sammen med deres fravær fra Oltmannsiellopsis cpDNA antyder, at de opstod fra intragenom proliferation i slægten, der fører til Pseudendoclonium . Bemærk, at Eksplosionssøgninger af Oltmannsiellopsis petB intron-sekvensen mod GenBank-databasen ikke kunne påvise nogen homolog intron i andre organismer.

Tabel 4 gruppe i introner i Oltmannsiellopsis cpDNA
tabel 5 gruppe i-introner på identiske genplaceringer i Oltmannsiellopsis cpDNA, andre grønne alger cpDNA ‘er og landplantecpdna’ er

Genomstruktur og genpartitionering

mønsteret for genpartitionering inden for de enkelte kopiområder af Oltmannsiellopsis cpDNA adskiller sig væsentligt fra det forfædres partitioneringsmønster observeret for Mesostigma, Nephroselmis og streptophyte cpDNA ‘ er (Figur 1). Det store flertal af de 30 gener, der findes i SC1-regionen i Oltmannsiellopsis, findes typisk i den forfædres LSC-region, hvorimod SC2-regionen indeholder 52 gener, der er karakteristiske for den forfædres LSC-region ud over ti gener, der er karakteristiske for den forfædres SSC-region. Interessant nok inkluderer SC2 12 af de 14 LSC-gener, der er overført til SSC-regionen i Pseudendoclonium cpDNA. De to ekstraordinære Pseudendocloniumgener, der ikke har nogen homologer i Oltmannsiellopsis SC2, er trnH (gug) og trnL (caa); trnH(gug) genet ligger i SC1-regionen i Oltmannsiellopsis, mens trnL (caa) er gået tabt fra Oltmannsiellopsis cpDNA. I betragtning af genindholdet i Oltmannsiellopsis-enkeltkopieringsregionerne forekommer det upassende at mærke disse regioner i henhold til deres størrelser. Selvom SC1 er mindre end SC2, svarer det sandsynligvis til forfædres LSC-region, og SC2 er tilsyneladende afledt af forfædres SSC-region.

IR-sekvensen i Oltmannsiellopsis cpDNA er omkring 12 kb større end i Pseudendoclonium cpDNA og indeholder fem gener ud over dem, der findes i rRNA-operonen (Figur 1). Ved 18.510 bp er IR-sekvensen af Oltmannsiellopsis ens i størrelse som Chlamydomonas (tabel 1). Begge ir-kryds i Oltmannsiellopsis cpDNA omfatter gener (cemA og ftsH), hvoraf de kodende sekvenser udvides til regionerne med en enkelt kopi. Som i Pseudendoclonium IR transskriberes Oltmannsiellopsis rRNA-generne mod den enkelte kopiregion, der bærer de gener, der kortlægges til LSC i prasinophyte og streptophyte cpDNA ‘ er. I modsætning hertil transkriberes rRNA-operonen mod SSC-regionen i Nephroselmis og streptophyte cpDNA ‘ er. Orienteringen af rRNA-operonen kan ikke etableres i Chlamydomonas cpDNA på grund af de omfattende krypterede enkeltkopierede regioner, og denne orientering forbliver ukendt i Chlorella cpDNA på grund af IR-tabet.

i betragtning af at Oltmannsiellopsis og Pseudendoclonium repræsenterer forskellige, tidlige divergerende slægter af Ulvophyceae, antyder de slående ligheder mellem de firkantede arkitekturer af Oltmannsiellopsis og Pseudendoclonium cpDNA ‘ er, at både det atypiske genpartitioneringsmønster og den usædvanlige orientering af IR var karakteristiske for chloroplastgenomet af tidligste divergerende ulvophytter. Vores data forudsiger, at SSC-regionen for den sidste fælles forfader til Oltmannsiellopsis og Pseudendoclonium cpDNA ‘er indeholdt 12 af de gener, der normalt findes i LSC-regionen i Nephroselmis og streptophyte cpDNA’ er, hvorimod LSC-regionen udelukkende indeholdt gener, der er karakteristiske for den forfædres LSC-region. Følgelig, i slægten, der førte til Pseudendoclonium, to ekstra gener blev overført til SSC-regionen, hvorimod 40 yderligere gener migrerede til denne region i Oltmannsiellopsis-slægten. Selvom mekanismerne bag disse genmigrationer mellem regioner med en enkelt kopi forbliver ukendte, involverede de sandsynligvis intramolekylære eller intermolekylære rekombinationshændelser. Analysen af konserverede genklynger rapporteret nedenfor indikerer tydeligt, at flere gener blev overført sammen i løbet af disse migrationer.

gener er blevet mere omfattende blandet mellem de to enkeltkopierede regioner i Chlamydomonas cpDNA (Figur 1). Det kan forestilles, at under udviklingen af ulvophytes og chlorophycean grønalger, det forfædres mønster af genpartitionering blev forstyrret i successive trin, med en Pseudendocloniumlignende organisation, der udviklede sig til en Oltmannsiellopsis-lignende organisation, hvilket i sidste ende fører til den omfattende scrambling af gener observeret i Chlamydomonas. I betragtning af fraværet af IR fra Chlorella-genomet er det meget vanskeligt at fastslå, om transkriptionsretningen af rRNA-operonen ændrede sig, og om gener blev flyttet fra en genomisk region til en anden under udviklingen af trebuksiofytter. Tab af IR er normalt forbundet med mange genomlejringer ; i tilfælde af Chlorella cpDNA er imidlertid alle de gener, der normalt findes i den forfædres SSC-region, forblevet grupperet med undtagelse af tre gener (psaC, ycf20 og trnL(uag)) (Figur 1). Undersøgelser af IR-indeholdende chloroplastgenomer fra forskellige trebuksiofytlinjer vil være påkrævet for at teste, om nogle af genflytningerne identificeret her i både Oltmannsiellopsis og Pseudendoclonium cpDNA ‘ er stammer fra den fælles forfader til UTC-alger.

Genklyngning

den samlede genorganisation af Oltmannsiellopsis cpDNA adskiller sig meget fra dens Pseudendocloniumhomolog og ligner overraskende mere den af Chlorella cpDNA (figur 2). Oltmannsiellopsis og Chlorella cpDNA ‘er deler 21 blokke af kolineære sekvenser, der indeholder i alt 65 gener, mens Oltmannsiellopsis og Pseudendoclonium cpDNA’ er har til fælles 18 blokke indeholdende 55 gener. Kun otte blokke indeholdende 19 gener er bevaret i Oltmannsiellopsis og Chlamydomonas genomer.

figur 2
figur2

Genklynger delt mellem Oltmannsiellopsis og andre UTC-alger cpDNA ‘ er. Delte klynger vises på Oltmannsiellopsis-genkortet som skiftevis række grønne og røde kasser. Gener placeret uden for konserverede klynger er vist i gråt. Gener, der mangler fra Chlamydomonas, Pseudendoclonium og Chlorella, er repræsenteret i beige. Omfanget af IR-og transkriptionsretningen af rRNA-generne betegnes med pile. Gener uden for kortet transskriberes med uret.

mange af de 24 forfædres genklynger, der deles af Mesostigma og Nephroselmis cpDNA ‘ er, er blevet forstyrret under udviklingen af UTC-grønne alger. I denne undersøgelse har vi analyseret 19 forfædres klynger; de fem resterende kunne ikke undersøges, fordi de gener, de indeholder, er gået tabt fra UTC cpDNA ‘ er (Figur 3). Alle 19 klynger er blevet brudt mindst i en lejlighed under udviklingen af UTC-algerne. Med kun 12 breakpoints viser Chlorella cpDNA den stærkeste bevarelse af forfædres klynger. Med 20 breakpoints indtager Oltmannsiellopsis cpDNA en median position mellem Chlorella og Pseudendoclonium (24 breakpoints) cpDNA ‘ er, mens Chlamydomonas cpDNA afslører dobbelt så mange breakpoints (42 breakpoints). Chlamydomonas, Oltmannsiellopsis og Pseudendoclonium genomer deler fem breakpoints, der mangler i Chlorella cpDNA. Bortset fra disse breakpoints, Pseudendoclonium og Chlamydomonas cpDNA ‘er deler seks breakpoints, der er fraværende fra Oltmannsiellopsis og Chlorella cpDNA’ er. Der er ingen breakpoint eksklusivt til Oltmannsiellopsis og Chlamydomonas genomer.

figur 3
figur3

fragmenterede forfædres genklynger i cpDNA ‘ erne af UTC-alger. De angivne klynger findes i både Mesostigma og Nephroselmis cpDNA ‘ er. Bemærk, at rpl22 ikke er repræsenteret i den store ribosomale proteinklynge, fordi den kun er til stede i Mesostigma cpDNA (mellem rps19 og rps3). Fragmenteringssteder betegnes med pilespidser i forskellige nuancer over klyngerne: Chlamydomonas, fyldte pilespidser; Pseudendoclonium, mørkegrå pilespidser; Oltmannsiellopsis, lysegrå pilespidser; og Chlorella, åbne pilespidser. Gener, der mangler fra Chlamydomonas, Pseudendoclonium, Oltmannsiellopsis og Chlorella, er angivet med henholdsvis firkanter, cirkler, stjerner og dobbelt dolk. Genpolariteter er ikke vist.

to forfædres klynger viser breakpoints, der er unikke for Ulvophyceae. Den næsten universelt konserverede psbb-psbT-psbN-psbH-klynge blev fragmenteret i 5′ – slutningen af psbN og skabte to separate stykker, der hver koder for et par gener, i Oltmannsiellopsis cpDNA. I Pseudendoclonium-slægten førte introduktionen af et yderligere Brudpunkt på den modsatte side af psbN til flytningen af dette gen på DNA-strengen, der koder for psbB, psbT og psbH, uden nogen ændring i genrækkefølge. I Oltmannsiellopsis-slægten forekom tre breakpoints i den forfædres rRNA-operon for at generere en ny transkriptionsenhed, hvor rækkefølgen af trnA(ugc) og trnI(gau) gener er blevet vendt. Der er rapporteret om omarrangerede rRNA-operoner for cpDNA ‘ erne i Trebuksiophyt Chlorella ellipsoidea og ulvophyte Codium skrøbelig ; i disse tilfælde blev den forfædres rRNA-operon imidlertid opdelt i separate fragmenter, der transskriberes fra forskellige promotorer.

med hensyn til afledte genklynger ligner Oltmannsiellopsis cpDNA mest Chlorella cpDNA (figur 4). En afledt klynge defineres her som en gruppe gener med de samme relative polariteter i to eller flere UTC-genomer, men fraværende fra Mesostigma og Nephroselmis cpDNA ‘ er. Oltmannsiellopsis cpDNA deler fem afledte klynger med sin Chlorella homolog, hvorimod Pseudendoclonium cpDNA deler tre klynger, hvoraf den ene mangler fra Oltmannsiellopsis. Af de fire afledte klynger, der er fælles for Oltmannsiellopsis og Pseudendoclonium cpDNA ‘ er, findes ingen i Chlamydomonas cpDNA.

figur 4
figur4

afledte genklynger delt mellem cpDNA ‘ erne af UTC-alger. Fyldte / åbne kasser repræsenterer tilstedeværelsen / fraværet af klynger. Genpolariteter er ikke vist.

vi estimerede, at der kræves mindst 50 inversioner for at omdanne genorganisationen af Oltmannsiellopsis cpDNA til den for ethvert andet chlorophytgenom (Tabel 6). Sammenlignende analyser af cpDNA ‘ er fra landplanter og fra nært beslægtede chlamydomonader antyder, at inversioner repræsenterer den dominerende mekanisme for kloroplastgenomomlejringer i grønne planter. Imidlertid er inversioner muligvis ikke de eneste mutationshændelser, der forårsager genordensændringer i chlorophytes cpDNA ‘er, da transpositioner er blevet foreslået for at tage højde for nogle af de omlejringer, der er observeret i Campanulaceae og i subclover cpDNA’ er.

Tabel 6 minimalt antal inversioner, der tegner sig for genomlejringer mellem grønne alger cpDNA ‘ er

gentagne elementer

et stort antal SDR-elementer findes i Oltmannsiellopsis cpDNA (figur 5). Selvom disse elementer overvejende befinder sig inden for intergeniske afstandsstykker og introner, befolker nogle få kopier de kodende regioner i cemA, chlB, chlL, chlN, ftsH, rpoB, rpoC1 og rpoC2. De mest rigelige elementer kan klassificeres i fem grupper af ikke-overlappende gentagelsesenheder (A til E) på basis af deres primære sekvenser (Tabel 7). Deres størrelser spænder fra 7-21 bp, og deres kopinumre varierer fra 17 til mere end 250. Sekvensen af gentagelsesenhed a eller B er oftest knyttet til det omvendte komplement af den samme sekvens og danner således perfekte palindromer eller formodede stammesløjfestrukturer med en løkke på to a eller to T (figur 6). I nogle tilfælde udvides palindromerne eller stammedele af stamsløjfestrukturerne ved tilsætning af mindre hyppige gentagelser. Desuden forekommer et par kopier af gentagelsesenheder A og B som ensomme sekvenser, der repræsenterer sandsynligvis degenererede versioner af de mere almindelige arrangementer med palindromer eller stamsløjfestrukturer. Gentag enhed C kan danne stem-loop strukturer, med en løkke af variabel størrelse. Selvom gentagelsesenheder D og E ikke er forbundet med stem-loop-strukturer, ligger de i nærheden af andre gentagne elementer.

figur 5
figur5

positioner af SDR-elementer i Oltmannsiellopsis cpDNA. Oltmannsiellopsis cpDNA-sekvensen blev justeret mod sig selv ved hjælp af PipMaker. Regioner, der indeholder SDR ‘ er, kan identificeres som klynger af prikker. Ligheder mellem justerede regioner vises som gennemsnitlig procent identitet (mellem 50 og 100% identitet). Gener og deres polariteter betegnes med vandrette pile, og kodningssekvenser er repræsenteret af fyldte kasser.

Tabel 7 SDR-enheder i Oltmannsiellopsis cpDNA
figur 6
figur6

forudsagte sekundære strukturer dannet af SDR-enheder A og B i Oltmannsiellopsis cpDNA.

Sdr ‘erne i Oltmannsiellopsis cpDNA ligner ikke meget dem, der findes i andre UTC cpDNA’ er. Oltmannsiellopsis-gentagelserne er partiske i G + C, mens Chlorella-gentagelserne viser en bias i A + T. Pseudendoclonium og Chlamydomonas SDR ‘ er er også rige på G+C, men deres sekvenser deler ingen åbenlyse ligheder med oltmannsiellopsis-gentagelserne. Denne mangel på sekvenslighed mellem SDR ‘er afledt af forskellige UTC-genomer antyder, at SDR’ er er erhvervet uafhængigt i UTC-slægter. Den alternative hypotese om, at SDR ‘ er blev transmitteret lodret, kan imidlertid ikke udelukkes, hvis vi antager, at disse elementer udvikler sig i et meget hurtigt tempo. Undersøgelser af cpDNA ‘ er fra nært beslægtet UTC-taksa vil være påkrævet for at skelne mellem disse to hypoteser.

SDR ‘ er har sandsynligvis spillet en vigtig rolle i ombygningen af chloroplastgenomet i UTC-slægter. Der er tidligere observeret en sammenhæng mellem overflod af SDR ‘ er og omfanget af genomlejringer i UTC-algegenomer . Denne sammenhæng gælder stadig med tilsætningen af Oltmannsiellopsis chloroplast genomsekvens. Overfloden af SDR-elementer i Oltmannsiellopsis cpDNA er sammenlignelig med den, der blev observeret i Pseudendoclonium cpDNA (Figur 7), og gener er blevet omarrangeret i samme grad i begge genomer (Tabel 6). SDR ‘er i grøn plante cpDNA’ er kunne tjene som hot spots for ikke-homologe rekombinationelle begivenheder og føre til inversioner og transpositioner .

Figur 7
figur7

densiteter af SDR-elementer i Oltmannsiellopsis og andre chlorophyte cpDNA ‘ er som afsløret af REPuter. Gentagne elementer med identiske sekvenser er forbundet på genomernes cirkulære repræsentationer. Gentagelser større end 30 bp og 45 bp vises på henholdsvis de øverste og nederste paneler. Til disse analyser blev en kopi af IR-sekvensen slettet fra Nephroselmis, Pseudendoclonium, Oltmannsiellopsis og Chlamydomonas genomer.

Skriv et svar

Din e-mailadresse vil ikke blive publiceret.