identifieringen av de närmaste levande släktingarna till tetrapoder: Fylogenomiska lektioner för att lösa korta forntida internoder

identifiera de närmaste levande släktingarna till tetrapoder är en viktig, men ändå ifrågasatt fråga i ryggradsfylogenetik. Tre hypoteser är möjliga och att utesluta alternativ har visat sig svårt även med stora molekylära datamängder på grund av svagt fylogenetiskt signalkopplat icke-fylogenetiskt brus som härrör från relativt snabba specieringshändelser som inträffade för länge sedan (400 Ma). Här, vi återbesöker identiteten hos den närmaste levande släktingen till ryggradsdjur från ett fylogenomiskt perspektiv och inkluderar nya genomiska data för alla existerande lungfisksläkten. RNA-seq visar sig vara ett bra alternativ till genomisk sekvensering, vilket för närvarande inte är tekniskt genomförbart i lungfiskar på grund av deras enorma (50-130 Gb) och repetitiva genom. Vi undersökte de viktigaste källorna till Systematiskt fel, nämligen Long-branch attraction (LBA), kompositionell heterogenitet och distribution av saknade data och tillämpade olika korrigeringstekniker. En multispecies koalescerande metod används för att redogöra för djup koalescens som kan komma från de korta och djupa internoderna som skiljer tidiga sarkopterygiska splittringar. Sammanfogningsmetoder gynnade lungfiskar som närmaste levande släktingar till tetrapoder med starkt statistiskt stöd. Aminosyraprofilblandningsmodeller kan entydigt lösa denna svåra internod tack vare deras förmåga att undvika systematiska fel. Vi bedömde prestanda för olika plats heterogena modeller och datapartitionering och jämförde förmågan hos olika strategier för att övervinna LBA, inklusive taxon manipulation, minskning av bland-härstamning hastighet heterogenitet och avlägsnande av snabbt utvecklande eller kompositionellt heterogena positioner. Identifieringen av Lungfisk som systergrupp av tetrapoder är robust när det gäller effekterna av icke-stationär sammansättning och distribution av saknade data. Den multispecies koalescerande metoden rekonstruerade starkt stödda topologier som var kongruenta med sammanfogning, trots genomgripande genträd heterogenitet. Vi avvisar alternativa topologier för tidiga sarkopterygiska relationer genom att öka signal-brusförhållandet i våra anpassningar. Den analytiska pipeline som beskrivs här kombinerar probabilistisk fylogenomisk slutsats med metoder för att utvärdera datakvalitet, modell tillräcklighet, och bedöma systematiskt fel, och därmed kommer sannolikt att hjälpa till att lösa liknande svåra internoder i livets träd. .

Lämna ett svar

Din e-postadress kommer inte publiceras.