L’identificazione dei parenti viventi più vicini dei tetrapodi: Lezioni filogenomiche per la risoluzione di brevi internodi antichi

Identificare i parenti viventi più vicini dei tetrapodi è una questione importante, ma ancora contestata nella filogenetica dei vertebrati. Tre ipotesi sono possibili e escludere alternative si è dimostrato difficile anche con grandi insiemi di dati molecolari a causa del debole rumore non filogenetico accoppiato al segnale filogenetico derivante da eventi di speciazione relativamente rapidi avvenuti molto tempo fa (400 Ma). Qui, rivisitiamo l’identità del parente vivente più vicino dei vertebrati terrestri da una prospettiva filogenomica e includiamo nuovi dati genomici per tutti i generi di lungfish esistenti. RNA-seq dimostra di essere una grande alternativa al sequenziamento genomico, che attualmente non è tecnicamente fattibile in lungfishes a causa della loro enorme (50-130 Gb) e genomi ripetitivi. Abbiamo esaminato le più importanti fonti di errore sistematico, vale a dire long-branch attraction (LBA), eterogeneità compositiva e distribuzione dei dati mancanti e applicato diverse tecniche di correzione. Un approccio coalescente multispecie viene utilizzato per spiegare coalescenza profonda che potrebbe venire dagli internodi brevi e profondi che separano prime spaccature sarcopterigi. I metodi di concatenazione favorivano i lungfishes come i parenti viventi più vicini dei tetrapodi con un forte supporto statistico. I modelli della miscela di profilo dell’aminoacido possono risolvere senza ambiguità questo internode difficile grazie alla loro capacità di evitare l’errore sistematico. Abbiamo valutato le prestazioni di diversi modelli eterogenei di siti e partizionamento dei dati e confrontato la capacità di diverse strategie progettate per superare LBA, inclusa la manipolazione del taxon, la riduzione dell’eterogeneità del tasso di interlinea e la rimozione di posizioni in rapida evoluzione o composizionalmente eterogenee. L’identificazione di lungfish come gruppo fratello di tetrapodi è robusta per quanto riguarda gli effetti della composizione non stazionaria e della distribuzione dei dati mancanti. Il metodo coalescente multispecies ha ricostruito topologie fortemente supportate che erano congruenti con la concatenazione, nonostante l’eterogeneità pervasiva dell’albero genetico. Rifiutiamo topologie alternative per le prime relazioni sarcopterigiane aumentando il rapporto segnale-rumore nei nostri allineamenti. La pipeline analitica descritta qui combina l’inferenza filogenomica probabilistica con metodi per valutare la qualità dei dati, l’adeguatezza del modello e la valutazione dell’errore sistematico, e quindi è probabile che aiuti a risolvere internodi altrettanto difficili nell’albero della vita. .

Lascia un commento

Il tuo indirizzo email non sarà pubblicato.