Résultats et discussion
Dans cette étude, nous avons effectué la première analyse basée sur l’ADNmt du moment et de la topologie de la diversification au sein de la lignée de P. troglodytes en utilisant 24 génomes mitochondriaux de chimpanzés complets nouvellement dérivés. En intégrant simultanément des paramètres démographiques de spéciation et de population dans nos analyses, nous avons également obtenu des estimations tMRCA des principales lignées de primates jusqu’à l’ancêtre commun le plus récent précédant la scission des singes du Nouveau Monde des singes de l’Ancien Monde et des Grands Singes.
Nous avons déduit les phylogénies de notre alignement chimpanzé-ADNmt plus (fig. 3) et des alignements de chimpanzés bootstrappés (non représentés) dans un cadre BMCMC. L’approche des chimpanzés bootstrappés utilisait auparavant une spéciation de Noël standard, car chaque cycle de l’analyse ne comportait qu’une séquence par espèce ou sous-espèce. L’analyse chimpanzé-plus était plus complexe car elle combinait une spéciation antérieure de Yule à travers l’arbre avec des antécédents coalescents distincts au niveau de la population sur chaque clade de sous-espèces de chimpanzés. Les estimations de tMRCA entre les espèces résultant de ces deux approches sont statistiquement indiscernables (tableau 2), confirmant ainsi l’utilité de l’approche du modèle mixte, décrite pour la première fois par Ho et al. (2008), pour des analyses interspécifiques. Bien qu’il existe certaines divergences dans les comparaisons côte à côte avec des études individuelles, nos estimations interspécifiques de la tMRCA se situent dans les plages des estimations existantes basées sur le nucléaire et l’ADNmt des dates de divergence des primates (par exemple, Glazko et Nei 2003; Satta et al. 2004; Raaum et coll. 2005; Steiper et Young 2006; Hobolth et al. 2007). La topologie résultant de notre analyse PhyML de l’alignement chimpanzé-plus a révélé un support de nœud élevé et une topologie correspondant à celle de nos résultats BMCMC avec ou sans horloge moléculaire imposée comme prévu (voir Wertheim et al. 2010).
Tableau 2.
Inférences tMRCA des alignements d’ADNmt des Primates (en millions d’années).
tMRCA (95% HPD) a | |||
Taxon | Alignement Chimpanzé Plus | Alignement Chimpanzé Bootstrapped | Alignement Chimpanzé seulement |
Simiiformes | 43.533 (34.093–52.838) | 40.785 (31.159–50.501) | N/A |
M. sylvanus – P. hamadryas | 10.454 (8.217–12.705) | 10.07 (7.837–12.407) | N/A |
Catarrhini | 23.966 (22.327–26.228) | 23.867 (22.289–25.962) | N/A |
Hominoidea | 17.166 (15.745–18.661) | 17.15 (15.706–18.766) | N/A |
Hominidés | 13.807 (13.197–14.534) | 13.854 (13.186–14.537) | N/A |
Pongo | 3.867 (2.835–4.928) | 3.805 (2.806–4.837) | S.O. |
Pan-Homo – Gorille | 8.062 (7.093–9.165) | 8.189 (7.003–9.178) | N/A |
G. gorilla – G. g. gorilla | 0.142 (0.083–0.199) | 0.145 (.081-0.208) | N/A |
Pédé | 5.751 (5.234–6.351) | 5.758 (5.216–6.367) | N/A |
Pan | 2.149 (1.684–2.657) | 2.187 (1.621–2.663) | N/A |
P. troglodytes | 1.026 (0.811-1.263) | 1.041 (0.770–1.288) | 1.002 (0.734–1.269) |
P. t. troglodytes – P. t. schweinfurthii | 0.380 (0.296–0.476) | 0.339 (0.164–0.456) | 0.384 (0.235–0.536) |
P. t. schweinfurthii | 0.111 (0.077–0.146) | N/A | 0.116 (0.066–0.171) |
Troglodytes P.t. | 0.380 (0.296–0.476) | N/A | 0.384 (0.235–0.536) |
P. t. verus – P. t. ellioti | 0.510 (0.387-0.650) | 0.518 (0.340–0.679) | 0.508 (0.301–0.715) |
P.t. ellioti | 0.157 (0.102–0.215) | N/A | 0.157 (0.083–0.242) |
P.t. verus | 0.155 (0.101–0.213) | N/A | 0.148 (0.076–0.223) |
Remarque.- les valeurs a en caractères gras ont été échantillonnées à partir de distributions antérieures utilisées pour étalonner les estimations tMRCA (voir le texte pour plus d’informations).
Reconstruction phylogénétique de l’alignement des génomes de l’ADNmt « chimpanzé-plus ». Les séquences d’ADNmt (10 743 pb) ont été analysées en utilisant l’approche BMCMC chez BEAST. L’arbre MCC est présenté, avec le clade Pan troglodytes montré en boîte et agrandi. La sous-espèce de chaque échantillon a été déterminée par l’haplotype de l’ADNmt et est indiquée par la couleur. Les probabilités postérieures des nœuds bien soutenus sont représentées par des cercles remplis (90-99%) ou des astérisques (100%). Les cercles ouverts indiquent des nœuds calibrés par des fossiles. La lignée des troglodytes P.t. est paraphylétique, et l’un de ses échantillons (WE464) a été collecté dans la gamme P. t. ellioti (voir texte). Les détails spécifiques des estimations de la date du nœud sont inclus dans le tableau 2.
Notre étude met en œuvre plusieurs caractéristiques clés qui représentent des avancées importantes sur le terrain, y compris 1) l’estimation des TMRCA des sous-espèces de chimpanzés sur la base des données de l’ADNmt, 2) l’incorporation d’une horloge moléculaire détendue et la distribution lognormale des dates d’étalonnage fossiles, et 3) la fusion, en une seule analyse, d’un prieur de Noël au niveau de l’espèce à travers l’ensemble de l’arbre de primates avec des prieurs coalescents distincts pour la diversification de chaque sous-espèce de chimpanzé. Une étude de cette ampleur chez les chimpanzés était impossible avant l’ajout de nos 24 génomes mitochondriaux complets. Jusqu’à présent, les séquences complètes du génome de l’ADNmt n’étaient disponibles que pour l’une des quatre sous-espèces de chimpanzés (P. t. verus). Une conclusion à tirer de cette collection nouvellement élargie de données de séquence est la mesure dans laquelle le génome mitochondrial des chimpanzés communs évolue à un rythme d’horloge (fig. 4), une conclusion qui renforce l’utilité de notre approche pour la datation des événements de divergence.
Arbre à racines médianes démontrant la nature « horloge » de l’évolution de l’ADNmt des chimpanzés. Vingt-six séquences de P. troglodytes et une séquence de P. paniscus ont été analysées en utilisant l’approche BMCMC chez MrBayes. L’arbre de consensus de la règle majoritaire est présenté. Les pointes des branches sont colorées par espèce ou sous-espèce. Les modèles de relation sont les mêmes que dans la figure 3, mais les noms de séquence sont supprimés pour plus de clarté. Tous les nœuds sont bien pris en charge et les probabilités postérieures de tous les nœuds principaux sont de 100%.
Notre estimation de 2.149 (1.684-2.657) L’Amm pour la tMRCA de P. troglodytes et P. paniscus se situe dans les plages de dates de plusieurs études précédentes à un seul et à plusieurs locus (par exemple, ADNmt: Horai et al. 1992; Raaum et coll. 2005, chromosome Y : Stone et al. 2002, et autosomique: Bailey et al. 1992; Yu et coll. 2003; Becquet et coll. 2007), mais elle est nettement plus ancienne que les estimations de 0,9 Ma yielded produites par d’autres (par exemple, chromosome X : Kaessmann et al. 1999 et autosomique: Gagné et Hé 2005; Hé 2010). Deux des études autosomiques contradictoires ci-dessus (Yu et al. 2003; Won et Hey 2005) ont utilisé le même ensemble de données à 50 locus, le modèle « isolement avec migration » de Won et Hey produisant la plus jeune des deux estimations. Leur modèle conduit également à une tMRCA intra-P. troglodytes beaucoup plus récente (0,422 Ma) que celle rapportée ici (1,026 Ma) ou par Becquet et al. (2007) dans une autre étude autosomique multi-locus récente (0,84 Ma). Malgré cette similitude, les TMRCA au niveau des sous-espèces résultant de la méthode de la » distance carrée moyenne » utilisée par Becquet et al. sont incompatibles avec nos estimations du BMCMC. Presque toutes leurs plages de dates sont considérablement plus anciennes que la nôtre. Il est important de noter que les écarts de dates, tels que ceux mentionnés ci-dessus, pourraient être dus au fait que les différentes méthodes fournissent des estimations temporelles de différents événements. En particulier, le modèle « isolement avec migration » est conçu pour estimer les temps de divergence des populations de chimpanzés, alors que nos valeurs BMCMC fournissent des estimations de la tMRCA de l’arbre génétique mitochondrial.
L’analyse chimpanzé-plus a donné une estimation moyenne (95 % HPD) du tMRCA pour P. troglodytes de 1,026 (0,811–1,263) Ma (fig. 3), une valeur indiscernable de celle obtenue à partir de l’estimation du chimpanzé bootstrappé (tableau 2). Cette distribution a été utilisée pour calibrer la racine de l’analyse uniquement pour les chimpanzés. Encore une fois, ces trois approches ont conduit à des estimations qualitativement identiques de la divergence des sous-espèces de chimpanzés (tableau 2), confirmant que l’approche mixte-Yule / coalescente de notre analyse chimpanzé-plus est également valable au niveau intraspécifique.
Comme démontré précédemment (p. ex. Gagneux et al. 2001; Gonder et coll. 2006; Liu et coll. 2008), deux lignées majeures sont présentes au sein du clade commun des chimpanzés de l’arbre de l’ADNmt des primates (fig. 3). Le plus ancien de ces deux clades majeurs a un tMRCA de 0,510 (0,387–0,650) Ma et contient deux sous-espèces monophylétiques, P. t. verus et P. t. ellioti (anciennement connu sous le nom de P. t. vellerosus), chacune avec des TMRCA de ∼0,16 Ma. Le tMRCA du plus jeune des deux clades majeurs est estimé à 0,380 (0,296–0,476) Ma. Analyses de Gagneux et al. (2001) de plus de 300 haplotypes mitochondriaux (415 pb de la région témoin, région hypervariable I) n’ont trouvé aucun support pour la monophylie de la PT. troglodytes ou P. t. schweinfurthii au sein de ce clade, conduisant les auteurs à se demander si la lignée devrait plutôt être considérée comme une seule sous-espèce. Notre étude trouve P. t. schweinfurthii imbriqué monophylétiquement, avec un tMRCA de 0,111 (0,077–0,146), dans la lignée des troglodytes P. t. (fig. 3). Ce même schéma topologique a été rapporté plus tôt sur la base de séquences plus courtes (Liu et al. 2008).
La rivière Sanaga sert de barrière entre les deux principales lignées de chimpanzés, avec le clade P. t. ellioti/P. t. verus à l’ouest et les troglodytes P. t./P. t. clade de schweinfurthii à l’est. Cette barrière n’est cependant pas complète en tant qu’individu troglodyte PT (WE464; fig. 3) a été échantillonné au nord de la rivière Sanaga dans la chaîne P.t. ellioti au Cameroun (fig. 2) (voir aussi Gonder et al. 2006). À partir de la rivière Sanaga, l’aire de répartition primaire de P. t. ellioti s’étend à l’ouest jusqu’au Nigeria. L’aire de répartition principale de son parent le plus proche, P. t. verus, se trouve à des centaines de kilomètres, s’étendant vers l’ouest depuis le sud du Ghana. Aujourd’hui, peu de populations ont évité l’extinction entre les aires de répartition primaires de ces deux sous-espèces, et elles n’ont pas été bien échantillonnées. D’un point de vue phylogéographique, on ne sait pas ce qui était responsable historiquement du maintien de l’isolement entre les populations de P. t. verus et de P. t. ellioti. Le Dahomey Gap est une vaste étendue de forêt sèche s’étendant sur les actuels Bénin et Togo et dans l’est du Ghana. Il est supposé avoir joué un rôle majeur en tant que barrière géographique contribuant à façonner la distribution et la diversification de nombreux primates et autres espèces de mammifères dans la région (Booth, 1958) et n’a pas été exclu comme barrière pour ces deux espèces de chimpanzés les plus occidentales. Cependant, des preuves génétiques limitées impliquent le cours inférieur du fleuve Niger (au Nigeria) comme barrière entre P. t. verus et P. t. ellioti. Il semble que seuls deux chimpanzés aient été sous-typés ADNmt de la région de l’ouest du Nigeria située entre le Dahomey Gap et le cours inférieur du fleuve Niger. Ces individus se regroupent avec P. t. verus, ce qui démontre que cette espèce n’est pas entièrement absente à l’est de la brèche du Dahomey (Gonder et Disotell, 2006).
La barrière principale entre les troglodytes PT et PT est beaucoup plus facile à identifier. sous-espèce schweinfurthii, qui sont séparées par la rivière Ubangi dans le nord-ouest de la République démocratique du Congo. La position imbriquée de P. t. schweinfurthii au sein du clade de P. t. troglodytes indique que P. t. troglodytes a été établie comme sous-espèce pendant un certain temps (il y a∼380 000 ans), couvrant probablement une grande partie de son aire équatoriale occidentale existante. Ce n’est que plus tard (il y a 100 000 ans) qu’il semble que le PT naissant. la lignée schweinfurthii a été isolée du reste de sa population par la rivière Ubangi, conduisant à son expansion éventuelle à travers le continent vers l’est jusqu’en Ouganda et en Tanzanie.
Sur la base des seules données mitochondriales, il convient de désigner P. t. ellioti comme une sous-espèce, surtout si P. t. schweinfurthii reste classé comme sa propre sous-espèce plutôt que d’attribuer cette nomenclature de la lignée P. t. troglodytes comme le reste du clade au sein duquel il est imbriqué. Les aires de répartition des sous-espèces sont, pour la plupart, géographiquement distinctes, et les données morphométriques molaires identifient quatre sous-unités de chimpanzés qui correspondent aux quatre sous-espèces proposées (Pilbrow, 2006). L’analyse phylogénétique des virus infectant les chimpanzés soutient également cette classification. Les souches de SFV se divisent en quatre clades distincts, les virus de chaque clade infectant les chimpanzés sauvages de la même sous-espèce (Liu et al. 2008). Le virus de l’immunodéficience simienne (SIV), quant à lui, n’infecte que deux sous-espèces de chimpanzés, P. t. schweinfurthii et P. t. troglodytes. Une autre indication de l’isolement de P. t. schweinfurthii des troglodytes de P. t. est la découverte que leurs VSI appartiennent à des clades distincts sur l’arbre phylogénétique des VSI de chimpanzés et de singes, et que seules les souches de l’un des deux VSI de chimpanzés (celles des troglodytes de P. t.) sont connues pour avoir effectué la transition entre les espèces vers les lignées parentales du VIH (Keele et al. 2006).
Les inférences phylogénétiques basées sur des séquences mitochondriales — même des génomes mitochondriaux complets — sont basées sur un seul locus non combinatoire hérité de la mère et dont la taille effective de la population est relativement petite et doivent être interprétées avec prudence (Ballard et Rand, 2005). Néanmoins, notre étude combine une quantité considérable de nouvelles données sur la séquence de l’ADNmt des chimpanzés avec les méthodes de reconstruction phylogénétique les plus récentes. La combinaison des modèles démographiques de spéciation et de population en une seule analyse BMCMC de l’alignement chimpanzé-plus a donné des résultats qui ont été confirmés par nos analyses bootstrap-chimpanzé et chimpanzé uniquement modélisées de manière plus conventionnelle. La cohérence de ces trois méthodes est frappante; elles ont toutes fourni des tMRCA essentiellement identiques dans tout l’arbre. Ce résultat soutient l’idée que cette approche de modèle mixte, modifiée par Ho et al. (2008), pourrait s’avérer largement applicable aux études phylogénétiques de séquences à l’intérieur et entre populations ou espèces.
Notre méthode d’amorçage des taxons peut être largement pertinente car elle pourrait s’avérer une approche utile pour travailler avec de grands ensembles de données ou des alignements de séquences difficiles à calculer. L’échantillonnage aléatoire des séquences permet de convertir un alignement de nombreuses séquences provenant de nombreuses populations ou espèces en un alignement beaucoup plus petit qui peut être analysé avec une simple spéciation préalable. L’étape d’amorçage permet ensuite à chaque espèce ou population d’être échantillonnée de manière aléatoire et répétée. Cela élimine le besoin de fonder des inférences de clades entiers sur de petits sous-ensembles de séquences choisis arbitrairement.