het identificeren van het dichtstbijzijnde levende familielid (n) van tetrapoden is een belangrijke, maar nog steeds omstreden vraag in de fylogenetica van gewervelde dieren. Drie hypothesen zijn mogelijk en het uitsluiten van alternatieven heeft moeilijk zelfs met grote moleculaire gegevensreeksen toe te schrijven aan zwak phylogenetic signaal gekoppeld nonphylogenetic lawaai als gevolg van vrij snelle speciation gebeurtenissen die lang geleden voorkwamen (400 Ma) bewezen. Hier, herzien wij de identiteit van het dichtste levende familielid van gewervelde landdieren vanuit een phylogenomic perspectief en omvatten nieuwe genomic gegevens voor alle bestaande longvis geslachten. RNA-seq blijkt om een groot alternatief aan het genomic rangschikken te zijn, dat momenteel technisch niet haalbaar in longvissen toe te schrijven aan hun reusachtige (50-130 Gb) en repetitieve genomen is. We onderzochten de belangrijkste bronnen van systematische fouten, namelijk long-branch attraction( LBA), compositorische heterogeniteit en verspreiding van ontbrekende gegevens en gebruikten verschillende correctietechnieken. Een multispecies coalescentie benadering wordt gebruikt om rekening te houden met diepe coalescentie die zou kunnen komen van de korte en diepe internoden scheiden vroege sarcopterygische splitsingen. Concatenatiemethoden begunstigden longvissen als de dichtstbijzijnde levende verwanten van tetrapoden met sterke statistische ondersteuning. De modellen van het aminozuurprofielmengsel kunnen deze moeilijke internode ondubbelzinnig oplossen dankzij hun capaciteit om systematische fout te vermijden. We beoordeelden de prestaties van verschillende Site-heterogene modellen en data partitionering en vergeleken het vermogen van verschillende strategieën ontworpen om LBA te overwinnen, met inbegrip van taxon manipulatie, vermindering van tussen-lineage rate heterogeniteit en verwijdering van snel evoluerende of compositorisch heterogene posities. De identificatie van longvis als zustergroep van tetrapoden is robuust wat betreft de effecten van niet-stationaire samenstelling en verspreiding van ontbrekende gegevens. De multispecies coalescente methode reconstrueerde sterk ondersteunde topologieën die congruent waren met concatenatie, ondanks doordringende heterogeniteit van de genboom. We verwerpen alternatieve topologieën voor vroege sarcopterygische relaties door de signaal-ruisverhouding in onze uitlijningen te verhogen. De analytische pijpleiding die hier wordt geschetst combineert probabilistische phylogenomic gevolgtrekking met methodes voor het evalueren van gegevenskwaliteit, modeltoereikendheid, en het beoordelen van systematische fout, en zo zal waarschijnlijk helpen gelijkaardige moeilijke internodes in de boom van het leven oplossen. .