Identificarea celor mai apropiate rude vii ale tetrapodelor: lecții Filogenomice pentru rezolvarea internodelor antice scurte

identificarea celor mai apropiate rude vii ale tetrapodelor este o întrebare importantă, dar încă contestată în filogenetica vertebratelor. Trei ipoteze sunt posibile și excluderea alternativelor s-a dovedit dificilă chiar și cu seturi mari de date moleculare datorită semnalului filogenetic slab cuplat zgomot nonfilogenetic rezultat din evenimente de speciație relativ rapide care au avut loc cu mult timp în urmă (400 Ma). Aici, revizuim identitatea celei mai apropiate rude vii a vertebratelor terestre dintr-o perspectivă filogenomică și includem noi date genomice pentru toate genurile de pești lung existente. ARN-seq se dovedește a fi o alternativă excelentă la secvențierea genomică, care în prezent nu este fezabilă din punct de vedere tehnic la peștii pulmonari datorită genomurilor lor uriașe (50-130 Gb) și repetitive. Am examinat cele mai importante surse de eroare sistematică, și anume atracția pe ramuri lungi (LBA), eterogenitatea compozițională și distribuția datelor lipsă și am aplicat diferite tehnici de corecție. O abordare coalescentă multispecifică este utilizată pentru a explica coalescența profundă care ar putea proveni din internodurile scurte și profunde care separă diviziunile sarcopterigiene timpurii. Metodele de concatenare au favorizat peștii lungi ca fiind cele mai apropiate rude vii ale tetrapodelor cu un sprijin statistic puternic. Modelele de amestec de profil de aminoacizi pot rezolva fără echivoc acest internod dificil datorită capacității lor de a evita erorile sistematice. Am evaluat performanța diferitelor modele site-eterogene și partiționarea datelor și am comparat capacitatea diferitelor strategii concepute pentru a depăși LBA, inclusiv manipularea taxonilor, reducerea eterogenității ratei între linii și eliminarea pozițiilor cu evoluție rapidă sau compozițională eterogenă. Identificarea peștilor lung ca grup sora de tetrapode este robustă în ceea ce privește efectele compoziției și distribuției nestaționare a datelor lipsă. Metoda coalescentă multispecifică a reconstruit topologii puternic susținute care au fost congruente cu concatenarea, în ciuda eterogenității arborelui genic omniprezent. Respingem topologiile alternative pentru relațiile sarcopterigiene timpurii prin creșterea raportului semnal-zgomot în aliniamentele noastre. Conducta analitică prezentată aici combină inferența filogenomică probabilistică cu metode de evaluare a calității datelor, adecvarea modelului și evaluarea erorii sistematice și, prin urmare, este probabil să ajute la rezolvarea internodurilor la fel de dificile din arborele vieții. .

Lasă un răspuns Anulează răspunsul