výsledky a diskuse
v této studii jsme provedli první analýzu založenou na mtDNA načasování a topologii diverzifikace v linii P. troglodytes pomocí 24 nově odvozených mitochondriálních genomů šimpanzů v plné délce. Současným začleněním speciace a demografických parametrů na úrovni populace do našich analýz, také jsme získali odhady tMRCA hlavních linií primátů zpět k nejnovějšímu společnému předkovi předcházejícímu rozdělení opic Nového světa od opic starého světa a lidoopů.
odvodili jsme fylogenie pro naše zarovnání šimpanzů plus mtDNA (obr. 3) a bootstrapped-šimpanzí zarovnání (není zobrazeno) v rámci BMCMC. Přístup bootstrapped-šimpanz využil standardní speciaci Yule dříve, protože každý běh analýzy sestával pouze z jedné sekvence na druh nebo poddruh. Analýza šimpanz plus byla složitější, protože kombinovala speciaci Yule před stromem se samostatnými koalescent priors na úrovni populace na každém poddruhu šimpanze clade. Výsledné odhady tMRCA mezi druhy z těchto dvou přístupů jsou statisticky nerozeznatelné (Tabulka 2), což podporuje užitečnost přístupu smíšeného modelu, poprvé popsaného Ho et al. (2008), pro mezidruhové analýzy. Ačkoli některé nesrovnalosti existují v side-by-side srovnání s jednotlivými studiemi, naše mezidruhové tMRCA odhady spadají do rozmezí stávajících jaderných a mtDNA-založené odhady dat divergence primátů (např Glazko a Nei 2003; Satta et al . 2004; Raaum et al. 2005; Steiper a Young 2006; Hobolth et al. 2007). Topologie vyplývající z naší Fymlové analýzy zarovnání šimpanz plus odhalila vysokou podporu uzlů a topologii odpovídající našim výsledkům BMCMC s molekulárními hodinami uloženými podle očekávání nebo bez nich (viz Wertheim et al. 2010).
Tabulka 2.
tMRCA závěry z primátů mtDNA zarovnání (před miliony let).
tMRCA (95% HPD) a | |||
Taxon | šimpanz-Plus zarovnání | bootstrapped-šimpanz zarovnání | šimpanz-pouze zarovnání |
Simiiformes | 43.533 (34.093–52.838) | 40.785 (31.159–50.501) | neuvedeno |
m. sylvanus-P. hamadryas | 10.454 (8.217–12.705) | 10.07 (7.837–12.407) | Neuvedeno |
Catarrhiniho | 23.966 (22.327–26.228) | 23.867 (22.289–25.962) | Neuvedeno |
Hominoidea | 17.166 (15.745–18.661) | 17.15 (15.706–18.766) | Neuvedeno |
Hominidae | 13.807 (13.197–14.534) | 13.854 (13.186–14.537) | Neuvedeno |
Pongo | 3.867 (2.835–4.928) | 3.805 (2.806–4.837) | neuvedeno |
Pan-Homo-gorila | 8.062 (7.093–9.165) | 8.189 (7.003–9.178) | neuvedeno |
G. gorila-G. g. gorila | 0.142 (0.083–0.199) | 0.145 (.081-0.208) | neuvedeno |
Pan-Homo | 5.751 (5.234–6.351) | 5.758 (5.216–6.367) | neuvedeno |
Pan | 2.149 (1.684–2.657) | 2.187 (1.621–2.663) | neuvedeno |
P. troglodytes | 1.026 (0.811-1.263) | 1.041 (0.770–1.288) | 1.002 (0.734–1.269) |
P. t. troglodytes-P. t. schweinfurthii | 0.380 (0.296–0.476) | 0.339 (0.164–0.456) | 0.384 (0.235–0.536) |
P. t. schweinfurthii | 0.111 (0.077–0.146) | neuvedeno | 0.116 (0.066–0.171) |
P. t. troglodyty | 0.380 (0.296–0.476) | neuvedeno | 0.384 (0.235–0.536) |
P. t. verus-p. t. ellioti | 0.510 (0.387-0.650) | 0.518 (0.340–0.679) | 0.508 (0.301–0.715) |
P. t. ellioti | 0.157 (0.102–0.215) | neuvedeno | 0.157 (0.083–0.242) |
P. t. verus | 0.155 (0.101–0.213) | neuvedeno | 0.148 (0.076–0.223) |
Poznámka.- tučně byly vzorkovány hodnoty z předchozích distribucí použitých ke kalibraci odhadů tMRCA(další informace viz text).
fylogenetická rekonstrukce zarovnání genomů mtDNA“ šimpanz-plus“. sekvence mtDNA (10 743 bp) byly analyzovány pomocí přístupu BMCMC v BEAST. Je představen strom MCC, s Pan troglodytes clade zobrazenou v krabici a zvětšenou. Poddruh každého vzorku byl stanoven haplotypem mtDNA a je označen barvou. Zadní pravděpodobnosti dobře podporovaných uzlů jsou reprezentovány vyplněnými kruhy (90-99%) nebo hvězdičkami (100%). Otevřené kruhy označují fosilní kalibrované uzly. Linie P. t. troglodytes je parafyletická a jeden z jejích vzorků (WE464) byl odebrán v rozmezí p. t. ellioti (Viz text). Konkrétní podrobnosti o odhadech data uzlu jsou uvedeny v tabulce 2.
Naše studie implementuje několik klíčových funkcí, které představují důležitý pokrok v této oblasti, včetně 1) odhad poddruhu uvnitř šimpanzů tMRCAs na základě údajů mtDNA, 2) začlenění uvolněných molekulárních hodin a lognormální distribuce fosilních kalibračních dat a 3) fúze do jedné analýzy Yule na úrovni druhu před celým stromem primátů se samostatnými koalescent priors pro diverzifikaci každého poddruhu šimpanzů. Studie tohoto rozsahu u šimpanzů byla nemožná před přidáním našich 24 kompletních mitochondriálních genomů. Až dosud byly kompletní sekvence genomu mtDNA dostupné pouze pro jeden ze čtyř poddruhů šimpanzů (P. t.verus). Jeden závěr, který je třeba vyvodit z této nově rozšířené sbírky sekvenčních dat, je rozsah, v jakém se mitochondriální genom běžných šimpanzů vyvíjí tempem podobným hodinám (obr. 4), zjištění, které posiluje užitečnost našeho přístupu pro datování divergenčních událostí.
strom s kořeny uprostřed demonstrující“ hodinovou “ povahu evoluce šimpanze mtDNA. Dvacet šest P. troglodytů a jedna sekvence P. paniscus byly analyzovány pomocí přístupu BMCMC v MrBayes. Je prezentován strom konsensu většinové vlády. Špičky větví jsou zbarveny podle druhů nebo poddruhů. Vzory vztahů jsou stejné jako na obrázku 3, ale názvy sekvencí jsou pro přehlednost odstraněny. Všechny uzly jsou dobře podporovány a zadní pravděpodobnosti všech hlavních uzlů jsou 100%.
náš odhad 2.149 (1.684-2.657) Ma pro tMRCA P. troglodytes a P. paniscus spadá do období od několika předchozích studií s jedním a více lokusy (např. mtDNA: Horai et al. 1992; Raaum et al. 2005, Y-chromozom: Stone et al. 2002, a autosomální: Bailey et al. 1992; Yu a kol. 2003; Becquet et al. 2007), ale je výrazně starší než odhady ∼0,9 Ma získané od ostatních (např. X-chromozom: Kaessmann et al. 1999 a autosomal: Won and Hey 2005; Hey 2010). Dvě z konfliktních autosomálních studií výše (Yu et al. 2003; Won and Hey 2005) využil stejnou datovou sadu 50-locus, přičemž model Won and Hey „isolation with migration“ produkoval mladší ze dvou odhadů. Jejich model také vede k mnohem novějším uvnitř-P. troglodytes tMRCA (0.422 Ma), než je zde uvedeno (1.026 Ma) nebo Becquet et al. (2007) v další nedávné autozomální studii s více lokusy (0,84 Ma). Přes tuto podobnost, tMRCAs na úrovni poddruhu vyplývající z metody „průměrná čtvercová vzdálenost“, kterou použili Becquet et al. jsou v rozporu s našimi odhady BMCMC. Téměř všechny jejich časové rozsahy jsou podstatně starší než naše. Je důležité si uvědomit, že nesrovnalosti v datech, jako jsou výše uvedené, může být způsobeno skutečností, že různé metody poskytují časové odhady různých událostí. Zejména model“ izolace s migrací “ je navržen tak, aby odhadoval časy divergence populací šimpanzů, zatímco naše hodnoty BMCMC poskytují odhady tMRCA mitochondriálního genového stromu.
analýza šimpanzů Plus poskytla průměrný (95% HPD) odhad tMRCA pro P.troglodyty 1,026 (0,811–1,263) Ma (obr. 3), hodnota nerozeznatelná od hodnoty získané z odhadu bootstrapped-šimpanzů (Tabulka 2). Tato distribuce byla použita ke kalibraci kořene analýzy pouze pro šimpanze. Všechny tři tyto přístupy opět vedly ke kvalitativně identickým odhadům divergence poddruhů šimpanzů (Tabulka 2), což potvrzuje, že smíšený Yule / koalescentní přístup naší analýzy šimpanz plus je platný i na intraspecifické úrovni.
jak bylo prokázáno dříve (např. Gagneux et al. 2001; Gonder et al. 2006; Liu et al. 2008), dvě hlavní linie jsou přítomny ve společném šimpanzovém kladu stromu primátů mtDNA (obr. 3). Nejstarší z těchto dvou hlavních klad má tMRCA 0,510 (0,387–0,650) Ma a obsahuje dva monofyletické poddruhy, P. T. verus a p. t. ellioti (dříve známý jako P. t. vellerosus), každý s tMRCAs ∼0,16 Ma. TMRCA mladšího ze dvou hlavních klad se odhaduje na 0,380 (0,296–0,476) Ma. Analýzy gagneux et al. (2001) více než 300 mitochondriálních haplotypů (415 bp z kontrolní oblasti, hypervariabilní oblast I) nenalezlo žádnou podporu pro monofýlu P.t. troglodytes nebo P. T. schweinfurthii v tomto kladu, což vede autory k otázce, zda by linie měla být místo toho považována za jediný poddruh. Naše studie najde P. t. schweinfurthii vnořené monofyleticky, s tMRCA 0,111 (0,077-0,146–, v linii P. t. troglodytes (obr. 3). Stejný topologický vzorec byl hlášen dříve na základě kratších sekvencí (Liu et al . 2008).
řeka Sanaga slouží jako bariéra mezi dvěma hlavními liniemi šimpanzů, S P. T. ellioti / P. t. verus clade na západě a p. t.troglodytes/P. t. schweinfurthii clade na východ. Tato bariéra však není úplná jako jedinec P. t. troglodytes (WE464; obr. 3) byl odebrán vzorek severně od řeky Sanaga v pohoří p. t. ellioti v Kamerunu (obr. 2) (viz také Gonder et al. 2006). Od řeky Sanaga, primární rozsah P. T. ellioti sahá na západ do Nigérie. Primární rozsah jeho nejbližšího příbuzného, P. t. verus, je stovky kilometrů daleko a šíří se na západ od jižní Ghany. Dnes, jen málo populací se vyhnulo vymírání mezi primárními rozsahy těchto dvou poddruhů,a nebyly dobře odebrány vzorky. Z fylogeografického hlediska není jasné, co bylo historicky zodpovědné za udržení izolace mezi populacemi P. t. verus a p. t. ellioti. Dahomey Gap je velký úsek suchého lesa přes dnešní Benin A Togo a do východní Ghany. Předpokládá se, že hrálo hlavní roli jako geografická bariéra, která pomáhá formovat distribuci a diverzifikaci mnoha primátů a dalších druhů savců v regionu (Booth 1958) a nebyla vyloučena jako bariéra pro tyto dva nejzápadnější druhy šimpanzů. Omezené genetické důkazy však implikují dolní řeku Niger (v Nigérii) jako bariéru mezi P. T. verus a p.t. ellioti. Zdá se, že pouze dva šimpanzi byli mtDNA subtypováni z regionu v západní Nigérii mezi Dahomey Gap a dolní řekou Niger. Tito jedinci se shlukují S P. t. verus, což dokazuje, že tento druh zcela chybí na východ od Dahomey Gap (Gonder and Disotell 2006).
mnohem snazší identifikace je primární bariéra mezi P. t.troglodyty a p. t. schweinfurthii poddruh, které jsou odděleny řekou Ubangi v severozápadní Demokratické republice Kongo. Vnořená Poloha P. t. schweinfurthii v p. t. troglodytes clade naznačuje, že P. t. troglodytes byl založen jako poddruh po určitou dobu (∼před 380 000 lety), pravděpodobně pokrývající většinu jeho stávajícího západního rovníkového rozsahu. Teprve později (před 100 000 lety) se zdá, že počínající P.t. linie schweinfurthii byla izolována od zbytku své populace řekou Ubangi, což vedlo k její případné expanzi přes kontinent na východ až k Ugandě a Tanzanii.
pouze na základě mitochondriálních údajů je vhodné označit P. T. ellioti jako poddruh, zejména pokud P. t. schweinfurthii zůstává klasifikován jako svůj vlastní poddruh, spíše než přiřadit této rodové nomenklatuře P. t. troglodytes jako zbytek kladu, ve kterém je vnořen. Rozsahy poddruhů jsou z větší části geograficky odlišné a molární morfometrické údaje identifikují čtyři podjednotky šimpanzů, které odpovídají čtyřem navrhovaným poddruhům (Pilbrow 2006). Fylogenetická analýza virů infikujících šimpanze také podporuje tuto klasifikaci. Kmeny SFV spadají do čtyř odlišných klad, přičemž viry každého kladu infikují divoké šimpanze stejného poddruhu (Liu et al . 2008). Na druhé straně je známo, že virus opičí imunodeficience (SIV) infikuje pouze dva poddruhy šimpanzů, P. t. schweinfurthii a p.t. troglodyty. Další indikací izolace P. t. schweinfurthii z P. t. troglodytů je zjištění, že jejich Sivy spadají do odlišných kmenů na fylogenetickém stromě šimpanzů a opic SIV a je známo, že pouze kmeny z jednoho ze dvou šimpanzů Siv (kmeny z P. T. troglodytů) provedly přechod mezi druhy do rodičovských linií HIV (Keele et al . 2006).
fylogenetické závěry založené na mitochondriálních sekvencích-dokonce i úplných mitochondriálních genomech-jsou založeny pouze na jediném, mateřsky zděděném nekombinačním lokusu s relativně malou účinnou velikostí populace a musí být interpretovány opatrně (Ballard and Rand 2005). Nicméně, naše studie kombinuje značné množství nových sekvenčních dat šimpanze mtDNA s nejaktuálnějšími metodami fylogenetické rekonstrukce. Kombinace speciace a populačních demografických modelů do jediné analýzy BMCMC zarovnání šimpanzů Plus přinesla výsledky, které byly potvrzeny našimi konvenčně modelovanými bootstrapped-šimpanz a šimpanz pouze analýzy. Konzistence těchto tří metod je zarážející; všechny poskytovaly v podstatě identickou tMRCA v celém stromu. Tento výsledek podporuje představu, že tento smíšený modelový přístup, upraveno od Ho et al. (2008), by se mohlo ukázat jako široce použitelné pro fylogenetické studie sekvencí uvnitř a mezi populacemi nebo druhy.
náš způsob zavádění taxonů může být obecně relevantní, protože by se mohl ukázat jako užitečný přístup pro práci s velkými datovými sadami nebo jinak výpočetně obtížnými zarovnání sekvencí. Náhodné vzorkování sekvencí umožňuje převést zarovnání mnoha sekvencí z mnoha populací nebo druhů na mnohem menší zarovnání, které lze analyzovat jednoduchou speciací dříve. Krok bootstrapping pak umožňuje, aby každý druh nebo populace byly vzorkovány náhodně a opakovaně. To eliminuje potřebu založit závěry celých klad na malých a libovolně vybraných podmnožinách sekvencí.