Identifikasjonen Av Nærmeste Levende Slektning(er) Av Tetrapoder: Fylogenomiske Leksjoner For Å Løse Korte Gamle Internoder

Identifisere nærmeste levende slektning(er) av tetrapoder er et viktig, men likevel omstridt spørsmål i vertebrate fylogenetikk. Tre hypoteser er mulig og utelukker alternativer har vist seg vanskelig selv med store molekylære datasett på grunn av svak fylogenetisk signal koblet nonphylogenetic støy som følge av relativt rask artsdannelse hendelser som skjedde for lenge siden (400 Ma). Her, vi revidere identiteten til nærmeste levende slektning av land virveldyr fra en fylogenomisk perspektiv og inkluderer nye genomiske data for alle bevarte lungefisk slekter. RNA-seq viser seg å være et godt alternativ til genomisk sekvensering, som for tiden ikke er teknisk mulig i lungfishes på grunn av deres store (50-130 Gb) og repeterende genomer. Vi undersøkte de viktigste kildene til systematisk feil, nemlig long-branch attraction (lba), kompositorisk heterogenitet og distribusjon av manglende data og anvendt ulike korreksjonsteknikker. En multispecies coalescent tilnærming brukes til å redegjøre for dyp koalescens som kan komme fra de korte og dype internodes skille tidlig sarcopterygian deler. Sammenkoblingsmetoder favoriserte lungfishes som nærmeste levende slektninger av tetrapoder med sterk statistisk støtte. Aminosyreprofilblandingsmodeller kan utvetydig løse denne vanskelige internoden takket være deres evne til å unngå systematisk feil. Vi vurderte ytelsen til ulike site-heterogene modeller og data partisjonering og sammenlignet evnen til ulike strategier utviklet for å overvinne LBA, inkludert takson manipulasjon, reduksjon av blant-avstamning rate heterogenitet og fjerning av raskt utviklende eller sammensatt heterogene posisjoner. Identifisering av lungefisk som søstergruppe av tetrapoder er robust med hensyn til effekter av ikke-stasjonær sammensetning og distribusjon av manglende data. Multispecies coalescent metode rekonstruert sterkt støttet topologier som var kongruent med sammenkobling, til tross for gjennomgripende gent tree heterogenitet. Vi avviser alternative topologier for tidlige sarcopterygian relasjoner ved å øke signal-til-støy-forhold i våre justeringer. Den analytiske rørledningen skissert her kombinerer probabilistisk fylogenomisk slutning med metoder for å evaluere datakvalitet, modell tilstrekkelighet, og vurdere systematisk feil, og dermed er sannsynlig å bidra til å løse tilsvarende vanskelige internodes i tree of life. .

Legg igjen en kommentar

Din e-postadresse vil ikke bli publisert.