L’Identification du ou des Parents Vivants les Plus Proches des Tétrapodes: Leçons Phylogénomiques pour Résoudre les Entre-nœuds Anciens Courts

L’identification du ou des parents vivants les plus proches des tétrapodes est une question importante, mais toujours contestée en phylogénétique des vertébrés. Trois hypothèses sont possibles et exclure des alternatives s’est avéré difficile même avec de grands ensembles de données moléculaires en raison du faible bruit non phylogénétique couplé au signal phylogénétique résultant d’événements de spéciation relativement rapides survenus il y a longtemps (400 Ma). Ici, nous revisitons l’identité du parent vivant le plus proche des vertébrés terrestres d’un point de vue phylogénomique et incluons de nouvelles données génomiques pour tous les genres de poissons-poumons existants. L’ARN-seq s’avère être une excellente alternative au séquençage génomique, qui n’est actuellement techniquement pas réalisable chez les poissons-poumons en raison de leurs génomes énormes (50-130 Go) et répétitifs. Nous avons examiné les sources les plus importantes d’erreurs systématiques, à savoir l’attraction à longue branche (LBA), l’hétérogénéité de composition et la distribution des données manquantes et avons appliqué différentes techniques de correction. Une approche par coalescence multi-espèces est utilisée pour tenir compte de la coalescence profonde qui pourrait provenir des entre-nœuds courts et profonds séparant les divisions sarcoptérygiennes précoces. Les méthodes de concaténation ont favorisé les poissons-poumons en tant que parents vivants les plus proches des tétrapodes avec un fort soutien statistique. Les modèles de mélange de profils d’acides aminés peuvent résoudre sans ambiguïté cet entre-nœuds difficile grâce à leur capacité à éviter les erreurs systématiques. Nous avons évalué la performance de différents modèles hétérogènes de sites et le partitionnement des données et comparé la capacité de différentes stratégies conçues pour surmonter LBA, y compris la manipulation des taxons, la réduction de l’hétérogénéité du taux d’hétérogénéité entre les lignées et la suppression de positions en évolution rapide ou hétérogènes sur le plan de la composition. L’identification des poissons-poumons en tant que groupe frère de tétrapodes est robuste en ce qui concerne les effets de la composition non stationnaire et de la distribution des données manquantes. La méthode de coalescence multispécifique a reconstruit des topologies fortement soutenues qui étaient congruentes à la concaténation, malgré l’hétérogénéité omniprésente des arbres géniques. Nous rejetons les topologies alternatives pour les relations sarcoptérygiennes précoces en augmentant le rapport signal sur bruit dans nos alignements. Le pipeline analytique décrit ici combine l’inférence phylogénomique probabiliste avec des méthodes d’évaluation de la qualité des données, de l’adéquation du modèle et de l’évaluation des erreurs systématiques, et est donc susceptible d’aider à résoudre des entre-nœuds tout aussi difficiles dans l’arbre de vie. .

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée.