the Identification of the Closest Living Relative(s) of Tetrapods: Phylogenomic Lessons for Resolving Short Ancient Internodes

Identyfikacja najbliższego żyjącego krewnego (s) tetrapods jest ważnym, ale wciąż spornym pytaniem w filogenetyce kręgowców. Możliwe są trzy hipotezy, a wykluczenie alternatyw okazało się trudne nawet w przypadku dużych zbiorów danych molekularnych ze względu na słaby sygnał filogenetyczny sprzężony z niefilogenetycznym szumem wynikającym ze stosunkowo szybkich specjacji, które miały miejsce dawno temu (400 Ma). W tym miejscu ponownie przyjrzymy się tożsamości najbliższego żyjącego krewnego kręgowców lądowych z perspektywy filogenomicznej i uwzględnimy nowe dane genomowe dla wszystkich istniejących rodzajów ryb lungfish. RNA-seq okazuje się być świetną alternatywą dla sekwencjonowania genomowego, które obecnie nie jest technicznie wykonalne u Lungfish ze względu na ich ogromne (50-130 Gb) i powtarzalne genomy. Zbadaliśmy najważniejsze źródła błędów systematycznych, a mianowicie przyciąganie długich gałęzi (LBA), heterogeniczność składu i rozkład brakujących danych oraz zastosowaliśmy różne techniki korekcji. Wielogatunkowe podejście koalescencyjne jest używane do uwzględnienia głębokiego koalescencji, która może pochodzić z krótkich i głębokich międzywęźli oddzielających wczesne podziały sarcopterygian. Metody konkatenacji faworyzowały lungfishes jako najbliższych żyjących krewnych czworonogów o silnym wsparciu statystycznym. Modele mieszanek profili aminokwasowych mogą jednoznacznie rozwiązać tę trudną internodę dzięki swojej zdolności do unikania systematycznych błędów. Oceniliśmy wydajność różnych modeli heterogenicznych lokalizacji i podziału danych oraz porównaliśmy zdolność różnych strategii mających na celu przezwyciężenie LBA, w tym manipulacji taksonami, zmniejszenia heterogeniczności między liniami i usuwania szybko zmieniających się lub heterogenicznych pozycji składowych. Identyfikacja lungfish jako siostrzanej grupy tetrapodów jest solidna pod względem wpływu niestacjonarnego składu i dystrybucji brakujących danych. Wielogatunkowa metoda koalescencyjna zrekonstruowała silnie wspierane topologie, które były zgodne ze konkatenacją, pomimo wszechobecnej heterogeniczności drzewa genów. Odrzucamy alternatywne topologie dla wczesnych relacji sarcopterygian, zwiększając stosunek sygnału do szumu w naszych wyrównaniach. Opisywany tutaj rurociąg analityczny łączy probabilistyczne wnioskowanie filogenomiczne z metodami oceny jakości danych, adekwatności modelu i oceny błędu systematycznego, a zatem może pomóc rozwiązać podobnie trudne międzywęźla w drzewie życia. .

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany.