identifikace nejbližšího žijícího příbuzného(příbuzných) tetrapodů: Fylogenomické lekce pro řešení krátkých starověkých internodů

identifikace nejbližšího žijícího příbuzného(příbuzných) tetrapodů je důležitou, ale stále spornou otázkou ve fylogenetice obratlovců. Jsou možné tři hypotézy a vyloučení alternativ se ukázalo jako obtížné i u velkých molekulárních datových souborů kvůli slabému fylogenetickému signálu spojenému nefylogenetickému šumu vyplývajícímu z relativně rychlých speciačních událostí, ke kterým došlo již dávno (400 Ma). Tady, znovu zkoumáme identitu nejbližšího žijícího příbuzného suchozemských obratlovců z fylogenomické perspektivy a zahrnujeme nová genomická data pro všechny existující rody plicníků. RNA-seq se ukazuje jako skvělá alternativa k genomickému sekvenování, které v současné době není technicky proveditelné u plic kvůli jejich obrovským (50-130 Gb) a opakujícím se genomům. Zkoumali jsme nejdůležitější zdroje systematické chyby, a to přitažlivost dlouhých větví (LBA), kompoziční heterogenitu a distribuci chybějících dat a aplikovali různé korekční techniky. Multidruhový koalescentní přístup se používá k zohlednění hluboké koalescence, která by mohla pocházet z krátkých a hlubokých internodů oddělujících časné sarkopterygické rozdělení. Metody zřetězení upřednostňovaly plíce jako nejbližší žijící příbuzné tetrapodů se silnou statistickou podporou. Modely směsí aminokyselinových profilů mohou jednoznačně vyřešit tuto obtížnou internodu díky své schopnosti vyhnout se systematickým chybám. Hodnotili jsme výkon různých heterogenních modelů a rozdělení dat a porovnali jsme schopnost různých strategií určených k překonání LBA, včetně manipulace s taxony, snížení heterogenity mezi řádky a odstranění rychle se vyvíjejících nebo kompozičně heterogenních pozic. Identifikace lungfish jako sesterské skupiny tetrapodů je robustní, pokud jde o účinky nestacionárního složení a distribuce chybějících dat. Vícedruhová koalescentní metoda rekonstruovala silně podporované topologie, které byly shodné s konkatenací, navzdory všudypřítomné heterogenitě genových stromů. Odmítáme alternativní topologie pro rané sarkopterygické vztahy zvýšením poměru signál-šum v našich zarovnání. Zde popsaný analytický kanál kombinuje pravděpodobnostní fylogenomickou inferenci s metodami pro hodnocení kvality dat, přiměřenost modelu, a hodnocení systematické chyby, a proto pravděpodobně pomůže vyřešit podobně obtížné internodes ve stromu života. .

Napsat komentář

Vaše e-mailová adresa nebude zveřejněna.