obecné rysy
Tabulka 1 porovnává obecné rysy chloroplastového genomu oltmannsiellopsis cpdna s těmi ze čtyř Chlorofytových Cpdna, které byly dosud zcela sekvenovány, tj. genomy Nephroselmis, Chlorella, Pseudendoklonium a Chlamydomonas . Při 59,5% je celkový obsah a + T Cpdna Oltmannsiellopsis podobný obsahu Cpdna Nephroselmis, ale je významně nižší než obsah tří dříve sekvenovaných UTC genomů. Genom Oltmannsiellopsis se mapuje jako kruhová molekula 151 933 bp (Obrázek 1) a obsahuje 105 genů. Dvě kopie IR sekvence 18 510 bp, z nichž každá kóduje deset genů, jsou od sebe odděleny nerovnými regiony s jednou kopií, označenými SC1 a SC2. Stejně jako ostatní cpdna UTC je genom Oltmannsiellopsis méně hustě nabitý kódujícími sekvencemi než cpdna Mesostigma a Nephroselmis; při 59,2% je jeho hustota kódujících sekvencí podobná hustotě chlorella a Pseudendoklonium cpdna. Mezigenní spacery v Oltmannsiellopsis cpDNA mají SDR a mají průměrnou velikost 512 bp, což je hodnota srovnatelná s hodnotou pozorovanou pro Pseudendoklonium cpDNA (600 bp). Celkem pět intronů, z nichž všechny patří do rodiny skupiny I, bylo identifikováno v Oltmannsiellopsis cpDNA.
obsah genu a intronu
obsah genu Oltmannsiellopsis cpDNA je meziprodukt mezi obsahem chlorelly a Chlamydomonas cpdna (Tabulka 1). Ačkoli Oltmannsiellopsis a Pseudendoklonium cpdna kódují stejný počet genů, tyto genomy se ve svém genovém repertoáru mírně liší (Tabulka 2). Oltmannsiellopsis cpDNA si zachovala všechny tři CHL geny, které chybí z Pseudendoklonium cpDNA, ale ztratila ycf62, trnL (caa) a trnR(ccg). Ve srovnání s chlorella cpDNA chybí genomům Oltmannsiellopsis, Pseudendoklonium a Chlamydomonas sada pěti genů, tj. cysA, cysta a tři tRNA geny (trnL (gag), trnS (gga) a trnT (ggu)) (Tabulka 2). Absence tří genů (ycf62, trnL (caa) a trnR (ccg)) je jednoznačně sdílena Oltmannsiellopsis a Chlamydomonas cpdna, zatímco žádná specifická ztráta genu není sdílena Pseudendokloniem a Chlamydomonas cpdna. Jak Oltmannsiellopsis, tak Pseudendoklonium cpdna si zachovaly Gen trnR(ccu), který chybí ve všech ostatních kompletně sekvenovaných chlorofytových cpdna.
stejně jako v dříve zkoumaných genomech UTC chloroplastů jsou kódující oblasti několika genů v Cpdna Oltmannsiellopsis rozšířeny vzhledem k jejich protějškům Mesostigma(Tabulka 3). Většina genových expanzí v Oltmannsiellopsis je však méně rozsáhlá než v Pseudendokloniu; pouze cemA vykazuje delší kódovací sekvenci než jeho Pseudendoklonium homologue.
náš nález pěti intronů skupiny i v Cpdna Oltmannsiellopsis ostře kontrastuje s 27 introny skupiny i nalezenými v Pseudendoklonium cpDNA (Tabulka 1). Nižší množství intronů v Oltmannsiellopsis cpDNA představuje hlavně menší velikost tohoto genomu vzhledem k Pseudendoklonium cpDNA. Introny Oltmannsiellopsis přerušují tři geny (petB, psbA a rrl) nalezené v IR (Tabulka 4). Geny petB a psbA obsahují každý jeden intron, zatímco v rrl jsou přítomny tři introny. Všech pět intronů, s výjimkou intronu petB, je polohově a strukturálně homologní s dříve hlášenými introny v cpdna zelených rostlin (Tabulka 5). Zatímco homologové intronu Oltmannsiellopsis psbA jsou přítomni v Pseudendokloniu a Chlamydomonas, homologové tří intronů rrl se nacházejí ve větší rozmanitosti zelených rostlin. Vzhledem k tomu, že tyto homologní introny byly identifikovány v liniích UTC, mohly být zděděny vertikální dědičností od posledního společného předka řas UTC; zjištění, že potenciálně kódují naváděcí endonukleázy rodin LAGLIDADG nebo GIY-YIG (Tabulka 4), nám však neumožňuje vyloučit možnost, že byly získány horizontálním přenosem. Ačkoli většina z 16 introny skupiny I v Pseudendoklonium cpDNA nemají homology na identických příbuzných místech v jiných genomech chloroplastů ,jejich blízké strukturní a sekvenční podobnosti spolu s jejich nepřítomností v Oltmannsiellopsis cpDNA naznačují, že vznikly intragenomickou proliferací v linii vedoucí k Pseudendokloniu. Všimněte si, že výbuchové vyhledávání Intronové sekvence Oltmannsiellopsis petB proti databázi GenBank nezjistilo Žádný homologní intron v jiných organismech.
struktura genomu a dělení genů
vzorec dělení genů v regionech s jednou kopií Cpdna Oltmannsiellopsis se podstatně liší od vzorce dělení předků pozorovaného pro Mezostigma, Nephroselmis a streptofytové cpdna (Obrázek 1). Velká většina 30 geny nalezené v oblasti Sc1 Oltmannsiellopsis se obvykle nacházejí v oblasti předků LSC, zatímco oblast SC2 obsahuje 52 geny charakteristické pro oblast předků LSC kromě deseti genů charakteristických pro oblast předků SSC. Je zajímavé, že SC2 zahrnuje 12 ze 14 genů LSC, které byly přeneseny do oblasti SSC v Pseudendoklonium cpDNA. Dva výjimečné Pseudendokloniové geny, které nemají homology v Oltmannsiellopsis SC2, jsou trnH(gug) a trnL (caa); Gen trnH(gug) sídlí v oblasti Sc1 Oltmannsiellopsis, zatímco trnL (caa) byl ztracen z Oltmannsiellopsis cpDNA. Vzhledem k obsahu genů v regionech s jednou kopií Oltmannsiellopsis se zdá nevhodné označovat tyto oblasti podle jejich velikosti. Ačkoli SC1 je menší než SC2, pravděpodobně odpovídá oblasti LSC předků, a SC2 je zřejmě odvozen z oblasti SSC předků.
ir sekvence v Oltmannsiellopsis cpDNA je asi o 12 kb větší než v Pseudendoklonium cpDNA a obsahuje pět genů kromě těch, které se nacházejí v operonu rRNA (Obrázek 1). Při 18 510 bp je IR sekvence Oltmannsiellopsis podobná velikosti jako u Chlamydomonas (Tabulka 1). Obě IR křižovatky v Oltmannsiellopsis cpDNA zahrnují geny (cemA a ftsH), z nichž kódující sekvence expandují do oblastí s jednou kopií. Stejně jako v Pseudendoclonium IR, geny rRNA Oltmannsiellopsis jsou transkribovány do oblasti jedné kopie nesoucí geny, které mapují LSC v prasinofytových a streptofytových cpdna. Naproti tomu operon rRNA je transkribován směrem k oblasti SSC v nephroselmis a streptofytových cpdna. Orientace operonu rRNA nemůže být stanovena v chlamydomonas cpDNA kvůli značně kódovaným regionům s jednou kopií, a tato orientace zůstává v chlorella cpDNA neznámá kvůli ztrátě IR.
vzhledem k tomu, že Oltmannsiellopsis a Pseudendoklonium představují odlišné, časně odlišné linie Ulvophyceae, nápadné podobnosti mezi čtyřstrannými architekturami Oltmannsiellopsis a Pseudendoklonium cpdna naznačují, že jak atypický vzorec dělení genů, tak neobvyklá orientace IR byly charakteristické pro chloroplastový genom nejdříve se lišících ulvofytů. Naše data předpovídají, že oblast SSC posledního společného předka Oltmannsiellopsis a Pseudendoclonium cpdna obsahovala 12 genů, které se obvykle nacházejí v oblasti LSC v nephroselmis a streptofytových cpdna, zatímco oblast LSC obsahovala výhradně geny charakteristické pro oblast předků LSC. V důsledku toho byly v linii vedoucí k Pseudendokloniu přeneseny dva další geny do oblasti SSC, zatímco 40 dalších genů migrovalo do této oblasti v linii Oltmannsiellopsis. Ačkoli mechanismy, které jsou základem těchto migrací genů mezi regiony s jednou kopií, zůstávají neznámé, pravděpodobně zahrnovaly intramolekulární nebo intermolekulární rekombinační události. Níže uvedená analýza konzervovaných genových shluků jasně ukazuje, že v průběhu těchto migrací bylo několik genů přeneseno společně.
geny byly rozsáhleji zamíchány mezi dvěma regiony s jednou kopií v chlamydomonas cpDNA (Obrázek 1). Lze si představit, že během vývoje ulvofytů a chlorofyceových zelených řas, rodový vzorec dělení genů byl narušen v postupných krocích, s organizací podobnou Pseudendokloniu, která se vyvinula v Organizaci podobnou Oltmannsiellopsis, což nakonec vedlo k rozsáhlému míchání genů pozorovaných u Chlamydomonas. Vzhledem k absenci IR z genomu chlorelly je velmi obtížné zjistit, zda se změnil směr transkripce operonu rRNA a zda byly geny přemístěny z jedné genomové oblasti do druhé během vývoje trebouxiofytů. Ztráta IR je obvykle spojena s mnoha přesmyky genů ; v případě Chlorella cpDNA však všechny geny obvykle nalezené v oblasti SSC předků zůstaly seskupeny, s výjimkou tří genů (psaC, ycf20 a trnL (uag)) (Obrázek 1). Vyšetřování genomů chloroplastů obsahujících IR z odlišných linií trebouxiofytů bude vyžadováno k testování, zda některé z přemístění genů identifikovaných zde v Oltmannsiellopsis a Pseudendoclonium cpdna pocházejí ze společného předka řas UTC.
shlukování genů
celková genová organizace Cpdna Oltmannsiellopsis se značně liší od organizace Homologa Pseudendoklonia a překvapivě se více podobá organizaci Chlorella cpDNA (Obrázek 2). Oltmannsiellopsis a Chlorella cpdna sdílejí 21 bloků kolineárních sekvencí, které obsahují celkem 65 genů, zatímco Oltmannsiellopsis a Pseudendoklonium cpdna mají společné 18 bloků obsahujících 55 genů. V genomech Oltmannsiellopsis a Chlamydomonas je zachováno pouze osm bloků obsahujících 19 genů.
mnoho z 24 genových klastrů předků sdílených cpdna Mesostigma a Nephroselmis bylo během vývoje zelených řas UTC narušeno. V této studii, analyzovali jsme 19 klastry předků; pět zbývajících nebylo možné vyšetřit, protože geny, které obsahují, byly ztraceny z UTC cpdna (obrázek 3). Všech 19 shluků bylo během vývoje řas UTC přerušeno alespoň při jedné příležitosti. Pouze s 12 zarážky, Chlorella cpDNA zobrazuje nejsilnější zachování klastrů předků. S 20 zarážkami zaujímá Cpdna Oltmannsiellopsis střední pozici mezi cpdna Chlorellou a Pseudendokloniem (24 zarážek), zatímco Chlamydomonas cpDNA odhaluje dvakrát tolik zarážek (42 zarážek). Chlamydomonas, Oltmannsiellopsis a Pseudendoklonium genomy sdílejí pět hraničních bodů, které chybí v chlorella cpDNA. Kromě těchto zarážek sdílejí Pseudendoklonium a Chlamydomonas cpdna šest zarážek, které chybí v Oltmannsiellopsis a Chlorella cpdna. Neexistuje žádný bod zlomu exkluzivní pro genomy Oltmannsiellopsis a Chlamydomonas.
dva klastry předků zobrazují zarážky, které jsou jedinečné pro Ulvophyceae. Téměř univerzálně konzervovaný shluk psbB-psbT-psbN-psbH byl fragmentován na 5 ‚ konci psbN, vytvoření dvou samostatných kusů, každý kódující pár genů, v Oltmannsiellopsis cpDNA. V linii Pseudendoklonia vedlo zavedení dalšího bodu zlomu na opačné straně psbN k přemístění tohoto genu na řetězec DNA kódující psbB, psbT a psbH, aniž by došlo ke změně pořadí genů. V linii Oltmannsiellopsis došlo ke třem hranicím v operonu rRNA předků, aby se vytvořila nová transkripční jednotka, ve které bylo obráceno pořadí genů trnA(ugc) a trnI(gau). Přeskupené rRNA operony byly hlášeny pro cpdna Trebouxiophyte Chlorella ellipsoidea a ulvophyte Codium fragile; nicméně, v těchto případech, rodový rRNA operon byl rozdělen na samostatné fragmenty, které jsou transkribovány z různých promotorů.
pokud jde o odvozené genové klastry, Oltmannsiellopsis cpDNA je nejvíce podobná Chlorella cpDNA (obrázek 4). Odvozený shluk je zde definován jako skupina genů se stejnými relativními polaritami ve dvou nebo více UTC genomech, ale chybí v Mezostigma a Nephroselmis cpdna. Oltmannsiellopsis cpDNA sdílí pět odvozených shluků se svým Chlorella homologue, zatímco Pseudendoclonium cpDNA sdílí tři shluky, jeden z nich chybí v Oltmannsiellopsis. Ze čtyř odvozených shluků společných Oltmannsiellopsis a Pseudendoclonium cpdna, Žádný se nenachází v Chlamydomonas cpDNA.
odhadli jsme, že k transformaci genové organizace Cpdna Oltmannsiellopsis na organizaci jakéhokoli jiného genomu chlorofytů (Tabulka 6) by bylo zapotřebí minimálně 50 inverzí. Srovnávací analýzy cpdna ze suchozemských rostlin a z blízce příbuzných chlamydomonád naznačují, že inverze představují převládající mechanismus přeskupení genomu chloroplastů v zelených rostlinách. Nicméně, inverze nemusí být jedinými mutačními událostmi způsobujícími změny pořadí genů v chlorofytech cpdna, protože byly navrženy transpozice k zohlednění některých přeskupení pozorovaných u Campanulaceae a v subclover cpdna.
opakované prvky
velké množství prvků SDR se nachází v Oltmannsiellopsis cpDNA (obrázek 5). Ačkoli se tyto prvky nacházejí převážně v mezigenních distancích a intronech, několik kopií naplňuje kódovací oblasti cemA, chlB, chlL, chlN, ftsH, rpoB, rpoC1 a rpoC2. Nejhojnější prvky lze rozdělit do pěti skupin nepřekrývajících se opakujících se jednotek (a až E) na základě jejich primárních sekvencí (Tabulka 7). Jejich velikost se pohybuje od 7-21 bp a jejich počet kopií se pohybuje od 17 do více než 250. Sekvence opakovací jednotky a nebo B je nejčastěji spojena s reverzním doplňkem stejné sekvence, čímž se vytvářejí dokonalé palindromy nebo domnělé struktury kmenové smyčky se smyčkou dvou A nebo dvou T (obrázek 6). V některých případech jsou palindromy nebo kmenové části struktur kmenových smyček rozšířeny přidáním méně častých opakování. Dále, několik kopií opakujících se jednotek A A B se vyskytuje jako osamělé sekvence, představující pravděpodobně degenerované verze běžnějších uspořádání s palindromy nebo strukturami kmenových smyček. Opakovací jednotka C může tvořit struktury kmenových smyček se smyčkou proměnné velikosti. Ačkoli opakující se jednotky D A E nejsou spojeny se strukturami kmenových smyček, sídlí v blízkosti jiných opakovaných prvků.
SDR v Oltmannsiellopsis cpDNA se příliš nepodobají těm, které jsou přítomny v jiných UTC cpdna. Opakování Oltmannsiellopsis je zkreslené v G + C, zatímco opakování chlorelly vykazuje zkreslení v A + T. Pseudendoklonium a Chlamydomonas SDR jsou také bohaté na G + C, ale jejich sekvence nesdílejí žádné zjevné podobnosti s opakováními Oltmannsiellopsis. Tento nedostatek sekvenčních podobností mezi SDR odvozenými z odlišných genomů UTC naznačuje, že SDR byly získány nezávisle v liniích UTC. Alternativní hypotézu, že SDR byly přenášeny svisle, však nelze vyloučit, pokud předpokládáme, že se tyto prvky vyvíjejí velmi rychlým tempem. K rozlišení těchto dvou hypotéz budou vyžadovány studie cpdna z úzce souvisejících taxonů UTC.
SDR s největší pravděpodobností hrály hlavní roli při remodelaci genomu chloroplastů v liniích UTC. Korelace byla dříve pozorována mezi množstvím SDR a rozsahem přeskupení genů v genomech řas UTC . Tato korelace stále platí s přidáním sekvence genomu chloroplastu Oltmannsiellopsis. Množství prvků SDR v Cpdna Oltmannsiellopsis je srovnatelné s množstvím pozorovaným u Pseudendoklonium cpDNA (Obrázek 7) a geny byly v obou genomech v podobném rozsahu přeskupeny (Tabulka 6). SDR v cpdna zelených rostlin by mohly sloužit jako horká místa pro nehomologní rekombinační události a vést k inverzím a transpozicím .