Risultati e discussione
In questo studio, abbiamo eseguito la prima analisi basata su mtDNA dei tempi e della topologia della diversificazione all’interno del lignaggio P. troglodytes utilizzando 24 genomi mitocondriali scimpanzé a lunghezza intera di nuova derivazione. Incorporando simultaneamente speciazione e parametri demografici a livello di popolazione nelle nostre analisi, abbiamo anche ottenuto stime tMRCA dei principali lignaggi primati di nuovo al più recente antenato comune che precede la scissione delle scimmie del Nuovo Mondo da scimmie del Vecchio Mondo e le Grandi scimmie.
Abbiamo dedotto le filogenie per il nostro allineamento mtDNA scimpanzé-plus (fig. 3) e allineamenti bootstrap-scimpanzé (non mostrati) in un framework BMCMC. L “approccio bootstrap-scimpanzé utilizzato una speciazione Yule standard prima perché ogni esecuzione dell” analisi consisteva di una sola sequenza per specie o sottospecie. L’analisi scimpanzé-plus era più complessa perché combinava una speciazione Yule precedente attraverso l’albero con priori coalescenti a livello di popolazione separati su ogni clade di sottospecie di scimpanzé. Le stime tMRCA tra specie risultanti da questi due approcci sono statisticamente indistinguibili (Tabella 2), supportando così l’utilità dell’approccio a modello misto, descritto per la prima volta da Ho et al. (2008), per analisi interspecifiche. Sebbene esistano alcune discrepanze nei confronti affiancati con studi individuali, le nostre stime interspecifiche di tMRCA rientrano negli intervalli delle stime esistenti basate su nucleare e mtDNA delle date di divergenza dei primati (ad esempio, Glazko e Nei 2003; Satta et al. 2004; Raaum et al. 2005; Steiper e Young 2006; Hobolth et al. 2007). La topologia risultante dalla nostra analisi PhyML dell’allineamento scimpanzé-plus ha rivelato un elevato supporto ai nodi e una topologia che corrisponde a quella dei nostri risultati BMCMC con o senza un orologio molecolare imposto come previsto (vedi Wertheim et al. 2010).
Tabella 2.
Inferenze tMRCA da allineamenti mtDNA primati (in milioni di anni fa).
tMRCA (95% HPD)un | |||
Taxon | Scimpanzé-Plus Allineamento | Bootstrap-Scimpanzé Allineamento | Scimpanzé Solo di Allineamento |
Simiiformes | 43.533 (34.093–52.838) | 40.785 (31.159–50.501) | N/A |
M. silvano–P. amadriade | 10.454 (8.217–12.705) | 10.07 (7.837–12.407) | N/A |
Catarrhini | 23.966 (22.327–26.228) | 23.867 (22.289–25.962) | N/A |
Hominoidea | 17.166 (15.745–18.661) | 17.15 (15.706–18.766) | N/A |
Hominidae | 13.807 (13.197–14.534) | 13.854 (13.186–14.537) | N/A |
Pongo | 3.867 (2.835–4.928) | 3.805 (2.806–4.837) | N/A |
Pan–Homo–il Gorilla | 8.062 (7.093–9.165) | 8.189 (7.003–9.178) | N/A |
G. gorilla–G. g. gorilla | 0.142 (0.083–0.199) | 0.145 (.081-0.208) | N/A |
Pan–Homo | 5.751 (5.234–6.351) | 5.758 (5.216–6.367) | N/A |
Pan | 2.149 (1.684–2.657) | 2.187 (1.621–2.663) | N/A |
P. troglodytes | 1.026 (0.811-1.263) | 1.041 (0.770–1.288) | 1.002 (0.734–1.269) |
P. t. troglodytes–P. t. schweinfurthii | 0.380 (0.296–0.476) | 0.339 (0.164–0.456) | 0.384 (0.235–0.536) |
P. t. schweinfurthii | 0.111 (0.077–0.146) | N/A | 0.116 (0.066–0.171) |
P. t. troglodytes | 0.380 (0.296–0.476) | N/A | 0.384 (0.235–0.536) |
P. t. verus–P. t. ellioti | 0.510 (0.387-0.650) | 0.518 (0.340–0.679) | 0.508 (0.301–0.715) |
P. t. ellioti | 0.157 (0.102–0.215) | N/A | 0.157 (0.083–0.242) |
P. t. verus | 0.155 (0.101–0.213) | N/A | 0.148 (0.076–0.223) |
Nota.- a Valori in grassetto sono stati campionati da distribuzioni precedenti utilizzati per calibrare le stime tMRCA (vedere il testo per ulteriori informazioni).
Ricostruzione filogenetica dell’allineamento dei genomi mtDNA “scimpanzé-plus”. Le sequenze mtDNA (10.743 bp) sono state analizzate utilizzando l’approccio BMCMC in BEAST. Viene presentato l’albero MCC, con il clade Pan troglodytes mostrato in scatola e ingrandito. La sottospecie di ciascun campione è stata determinata dall’aplotipo mtDNA ed è indicata dal colore. Le probabilità posteriori di nodi ben supportati sono rappresentate da cerchi pieni (90-99%) o asterischi (100%). I cerchi aperti indicano nodi calibrati con fossili. Il lignaggio P. t. troglodytes è parafiletico e uno dei suoi campioni (WE464) è stato raccolto nella gamma P. t. ellioti (vedi testo). Dettagli specifici delle stime della data del nodo sono inclusi nella Tabella 2.
il Nostro studio realizza diverse caratteristiche chiave che rappresentano un grande progresso per il campo, di cui 1) la stima dell’interno-scimpanzé sottospecie tMRCAs basato sul dna mitocondriale di dati, 2) la costituzione di un rilassato orologio molecolare e la distribuzione lognormale di fossili di taratura: date, e 3) la fusione, in un’analisi, di una specie a livello di Yule prima di tutta la primate albero con separata coalescente priori per la diversificazione di ogni sottospecie di scimpanzé. Uno studio di questo ambito negli scimpanzé era impossibile prima dell’aggiunta dei nostri 24 genomi mitocondriali completi. Fino ad ora, le sequenze complete del genoma del mtDNA erano disponibili solo per una delle quattro sottospecie di scimpanzé (P. t. verus). Una conclusione da trarre da questa nuova collezione ampliata di dati di sequenza è la misura in cui il genoma mitocondriale degli scimpanzé comuni si evolve ad un tempo simile a un orologio (fig. 4), una scoperta che rafforza l’utilità del nostro approccio per la datazione degli eventi di divergenza.
Albero a radice centrale che dimostra la natura “orologio” dell’evoluzione degli scimpanzé mtDNA. Ventisei P. troglodytes e una sequenza P. paniscus sono stati analizzati utilizzando l’approccio BMCMC in MrBayes. Viene presentato l’albero del consenso della maggioranza. Le punte dei rami sono colorate per specie o sottospecie. I modelli di relazione sono gli stessi della figura 3, ma i nomi delle sequenze vengono rimossi per chiarezza. Tutti i nodi sono ben supportati e le probabilità posteriori di tutti i nodi principali sono del 100%.
La nostra stima di 2.149 (1.684-2.657) Ma per il tMRCA di P. troglodytes e P. paniscus rientra negli intervalli di date di diversi precedenti studi a singolo e multi-locus (ad esempio, mtDNA: Horai et al. 1992; Raaum et al. 2005, cromosoma Y: Stone et al. 2002, e autosomica: Bailey et al. 1992; Yu et al. 2003; Becquet et al. 2007), ma è marcatamente più vecchio delle stime di ∼0.9 Ma fornite da altri (ad esempio, cromosoma X: Kaessmann et al. 1999 e autosomica: Won e Hey 2005; Hey 2010). Due degli studi autosomici contrastanti sopra (Yu et al. 2003; Won e Hey 2005) hanno utilizzato lo stesso set di dati di 50 locus, con il modello “isolamento con migrazione” di Won e Hey che produce la più giovane delle due stime. Il loro modello porta anche a una molto più recente all’interno-P. troglodytes tMRCA (0.422 Ma) di quanto riportato qui (1.026 Ma) o da Becquet et al. (2007) in un altro recente studio autosomico multi-locus (0,84 Ma). Nonostante questa somiglianza, le TMRCA a livello di sottospecie derivano dal metodo della “distanza quadrata media” impiegato da Becquet et al. sono incoerenti con le nostre stime BMCMC. Quasi tutti i loro intervalli di date sono considerevolmente più vecchi del nostro. È importante notare che le discrepanze nelle date, come quelle sopra menzionate, potrebbero essere dovute al fatto che i diversi metodi forniscono stime temporali di eventi diversi. In particolare, il modello” isolamento con migrazione ” è progettato per stimare i tempi di divergenza delle popolazioni di scimpanzé, mentre i nostri valori BMCMC forniscono stime della tMRCA dell’albero genico mitocondriale.
L’analisi scimpanzé-plus ha prodotto una stima media (95% HPD) tMRCA per P. troglodytes di 1.026 (0.811-1.263) Ma (fig. 3), un valore indistinguibile da quello ottenuto dalla stima bootstrap-scimpanzé (Tabella 2). Questa distribuzione è stata utilizzata per calibrare la radice dell’analisi solo scimpanzé. Ancora una volta, tutti e tre questi approcci hanno portato a stime qualitativamente identiche della divergenza delle sottospecie di scimpanzé (Tabella 2), confermando che l’approccio misto-Yule/coalescente della nostra analisi scimpanzé-plus è valido anche a livello intraspecifico.
Come dimostrato in precedenza (ad esempio, Gagneux et al. 2001; Gonder et al. 2006; Liu et al. 2008), due grandi lignaggi sono presenti all’interno del clade scimpanzé comune dell’albero primate mtDNA (fig. 3). Il più antico di questi due cladi principali ha una tMRCA di 0,510 (0,387–0,650) Ma e contiene due sottospecie monofiletiche, P. t. verus e P. t. ellioti (precedentemente noto come P. t. vellerosus), ciascuna con TMRCA di 0 0,16 Ma. Il tMRCA del più giovane dei due cladi principali è stimato a 0,380 (0,296–0,476) Ma. Analisi di Gagneux et al. (2001) di oltre 300 aplotipi mitocondriali (415 bp dalla regione di controllo, regione ipervariabile I) non hanno trovato alcun supporto per monofilia di P. t. troglodytes o P. t. schweinfurthii all’interno di questo clade, portando gli autori a chiedersi se il lignaggio debba invece essere considerato una singola sottospecie. Il nostro studio trova P. t. schweinfurthii nidificato monofileticamente, con un tMRCA di 0.111 (0.077-0.146), all’interno del lignaggio P. t. troglodytes (fig. 3). Questo stesso modello topologico è stato riportato in precedenza sulla base di sequenze più brevi (Liu et al. 2008).
Il fiume Sanaga funge da barriera tra i due principali lignaggi degli scimpanzé, con il clade P. t. ellioti/P. t. verus ad ovest e il clade P. t. troglodytes/P. t. schweinfurthii clade ad est. Questa barriera non è completa, tuttavia, come P. t. troglodytes individuale (WE464; fig. 3) è stato campionato a nord del fiume Sanaga all’interno del P. t. ellioti range in Camerun (fig. 2) (vedi anche Gonder et al. 2006). Dal fiume Sanaga, la gamma primaria di PT ellioti si estende ad ovest in Nigeria. La gamma primaria del suo parente più prossimo, P.t. verus, si trova a centinaia di chilometri di distanza, diffondendosi verso ovest dal Ghana meridionale. Oggi, poche popolazioni hanno evitato l’estinzione tra gli areali primari di queste due sottospecie e non sono state ben campionate. Dal punto di vista filogeografico, non è chiaro quale sia stato storicamente responsabile del mantenimento dell’isolamento tra le popolazioni di P. t. verus e P. t. ellioti. Il Dahomey Gap è un ampio tratto di foresta secca che si estende attraverso gli attuali Benin e Togo e nel Ghana orientale. Si ipotizza che abbia svolto un ruolo importante come barriera geografica contribuendo a modellare la distribuzione e la diversificazione di molti primati e altre specie di mammiferi nella regione (Booth 1958) e non è stato escluso come barriera per queste due specie di scimpanzé più occidentali. Tuttavia, prove genetiche limitate implicano il fiume Niger inferiore (in Nigeria) come barriera tra PT verus e PT ellioti. Sembra che solo due scimpanzé siano stati sottotipizzati mtDNA dalla regione nella Nigeria occidentale tra il Dahomey Gap e il fiume Niger inferiore. Questi individui si raggruppano con P. t. verus, dimostrando che questa specie non è del tutto assente ad est del Dahomey Gap (Gonder e Disotell 2006).
Molto più facile da identificare è la barriera primaria tra i trogloditi PT e PT. schweinfurthii sottospecie, che sono separati dal fiume Ubangi nel nord-ovest della Repubblica Democratica del Congo. La posizione annidata di P. t. schweinfurthii all’interno del clade P. t. troglodytes indica che P. t. troglodytes è stato stabilito come sottospecie per qualche tempo (∼380.000 anni fa), probabilmente coprendo gran parte del suo areale equatoriale occidentale esistente. Solo più tardi (∼100.000 anni fa), sembra che l’incipiente p.t. schweinfurthii lignaggio è stato isolato dal resto della sua popolazione dal fiume Ubangi, che porta alla sua eventuale espansione in tutto il continente ad est fino a Uganda e Tanzania.
In base ai soli dati mitocondriali, è opportuno designare P. t. ellioti come sottospecie, specialmente se P. t. schweinfurthii rimane classificato come sottospecie propria piuttosto che assegnare a questo lignaggio la nomenclatura di P. t. troglodytes come il resto del clade all’interno del quale è nidificato. Gli areali delle sottospecie sono, per la maggior parte, geograficamente distinti, e i dati morfometrici molari identificano quattro subunità di scimpanzé che corrispondono alle quattro sottospecie proposte (Pilbrow 2006). L’analisi filogenetica dei virus che infettano gli scimpanzé supporta anche questa classificazione. I ceppi SFV si dividono in quattro cladi distinti, con i virus di ciascun clade che infettano scimpanzé selvatici della stessa sottospecie (Liu et al. 2008). Il virus dell’immunodeficienza simiana (SIV), d’altra parte, è noto per infettare solo due sottospecie di scimpanzé, P. t. schweinfurthii e P. t. troglodytes. Un’ulteriore indicazione dell’isolamento di P. t. schweinfurthii da P. t. troglodytes è la scoperta che i loro SIV cadono in cladi distinti sull’albero filogenetico scimpanzé e scimmia SIV, e solo i ceppi di uno dei due SIV scimpanzé (quelli di P. t. troglodytes) sono noti per aver fatto la transizione tra le specie ai lignaggi genitori dell’HIV (Keele et al. 2006).
Le inferenze filogenetiche basate su sequenze mitocondriali—anche genomi mitocondriali completi—si basano solo su un singolo locus non combinato ereditato dalla madre con una dimensione di popolazione efficace relativamente piccola e devono essere interpretate con cautela (Ballard e Rand 2005). Tuttavia, il nostro studio combina una notevole quantità di nuovi dati di sequenza scimpanzé mtDNA con i metodi più attuali di ricostruzione filogenetica. La combinazione di speciazione e modelli demografici di popolazione in una singola analisi BMCMC dell’allineamento scimpanzé-plus ha prodotto risultati che sono stati confermati dalle nostre analisi bootstrap-scimpanzé e solo scimpanzé più convenzionalmente modellate. La coerenza di questi tre metodi è sorprendente; tutti hanno fornito tMRCA essenzialmente identico in tutto l’albero. Questo risultato supporta l’idea che questo approccio a modello misto, modificato da Ho et al. (2008), potrebbe rivelarsi ampiamente applicabile agli studi filogenetici di sequenze dall’interno e tra popolazioni o specie.
Il nostro metodo di bootstrap taxa può essere ampiamente rilevante in quanto potrebbe rivelarsi un approccio utile per lavorare con grandi set di dati o allineamenti di sequenza altrimenti computazionalmente difficili. Il campionamento casuale di sequenze consente di convertire un allineamento di molte sequenze da molte popolazioni o specie in un allineamento molto più piccolo che può essere analizzato con una semplice speciazione precedente. La fase di bootstrap consente quindi di campionare ogni specie o popolazione in modo casuale e ripetuto. Ciò elimina la necessità di basare le inferenze di interi cladi su piccoli sottoinsiemi di sequenze scelti arbitrariamente.