mandag 21. September 2020
selv innen genomikk hvor nye gjennombrudd forekommer noen få måneder, er fullføring av den første fullstendig sekvenserte menneskelige autosom en viktig prestasjon. Svært nøyaktig, ingen hull, ingen mis-tiltrer – bare kromosom 8 i all sin prakt. Det er en bemerkelsesverdig prestasjon, og Vi er beæret over At PacBio HiFi reads spilte en sentral rolle i å bidra til å oppnå det.
den komplette centromere sekvens av kromosom 8 viser et mangfold av satellitt gjentar og andre rikelig genomiske gjentar, nå med nær perfekt base-nivå oppløsning fra ende til ende. Jørgensen, g et al. (2020)
dette arbeidet er beskrevet i et preprint som nylig ble lagt ut til bioRxiv fra hovedforfatter Glennis Logsdon (@glennis_logsdon), seniorforfatter Evan Eichler, og deres samarbeidspartnere I Telomere-To-Telomere (T2T) Konsortiet. Det er en del AV det bredere t2t-initiativet for å sekvensere Og montere det første virkelig komplette menneskelige genomet og følger den tidligere utgivelsen av Det fullt sekvenserte X-kromosomet.
» siden kunngjøringen av sekvenseringen av det menneskelige genomet for 20 år siden, har menneskelige kromosomer forblitt uferdige på grunn av store regioner med svært identiske gjentakelser plassert innenfor sentromerer, segmental duplisering og de akrocentriske korte armene til kromosomer,» forfatterne noterer. «Fremkomsten av langlesede sekvenseringsteknologier og tilhørende algoritmer har nå gjort det mulig å systematisk samle disse regionene fra innfødt DNA for første gang.»
Kromosom 8 gjorde et attraktivt mål FOR T2TS første autosom på grunn av sin håndterbare centromere (tidligere estimert til 1,5 Mb til 2,2 Mb lang). Men kromosomet er også hjemmet til «en av de mest strukturelt dynamiske områdene i det menneskelige genomet – den β-defensin – genklyngen som ligger på 8p23—1-samt en neocentromere som ligger på 8q21.2, som i stor grad har vært uløst de siste 20 årene, » skriver forskerne. Β-defensin-klyngen spiller en nøkkelrolle i medfødt immunitet og strukturell variasjon i denne regionen har lenge vært involvert i menneskelig sykdom.
den nye forsamlingen, som adresserer alle fem av de tidligere ugjennomtrengelige hullene i det menneskelige referansegenomet, ble bygget med en smart metode ved hjelp av flere datasett, inkludert nøyaktige lange leser: «mer enn halvparten Av PacBio HiFi-dataene er inneholdt i leser større enn 17.8 kbp, med en median nøyaktighet som overstiger 99.9%.»Etter en stillas trinn basert På Oxford Nanopore leser, contigs montert Fra PacBio HiFi leser ble byttet inn for å gi base-par oppløsning. «Vi forbedret baseparets nøyaktighet av sekvensstillasene ved å erstatte raw ONT-sekvensen med flere konkordante PacBio HiFi-kontigs,» rapporterer teamet.
den komplette chr8-sekvensen klokker inn på 146 Mb og inneholder mer enn 3 Mb mangler Fra GRCh38. Som Logsdon et al. skriv, » resultatet er en hel-kromosom montering med en estimert base-pair nøyaktighet overstiger 99.99%.»
forskerne taklet også den persnickety β-defensin gene cluster, » som vi løst inn i et enkelt 7.06 Mbp locus-vesentlig større enn 4.56 Mbp-regionen i det nåværende menneskelige referansegenomet,» bemerker de. Nesten alle disse sekvensdataene-99,9934% av det, for å være presis-kom fra HiFi-leser. Den komplette centromere, i mellomtiden, utgjorde 2.08 Mb.
med denne vakre forsamlingen i hånden tok T2T-teamet det ut for et spinn. Først validerte de det med en rekke ortogonale verktøy, for eksempel optisk kartlegging. Deretter genererte De HiFi-data for kromosom 8-ortologene i sjimpanse, makaque og orangutang for å sammenligne sekvensdataene og rekonstruere den evolusjonære historien til det menneskelige autosomet. «Komparative og fylogenetiske analyser viser at den høyere ordens α-satellittstrukturen utviklet seg spesielt i great ape-forfederen, og den sentromere regionen utviklet seg med en lagdelt symmetri,» skriver teamet. «Vi anslår at mutasjonshastigheten til sentromere satellitt-DNA akselereres minst 2.2 ganger, og denne akselerasjonen strekker seg utover den høyere ordens α-satellitten inn i flankesekvensen.»
til Slutt utførte forskerne en analyse av full lengde transkripsjoner produsert Med Iso-Seq-metoden. Denne prosessen identifiserte «61 proteinkoding og 33 ikke-kodende loci som kartlegger bedre til denne ferdige kromosom 8-sekvensen enn Til GRCh38, inkludert oppdagelsen av nye gener kartlegging for å kopiere nummer polymorfe regioner,» rapporterer de. Tolv av disse nye genene ble avdekket i det vanskelige β-defensin locus alene.
en kombinasjon Av HiFi – genommontering og RNA-annotering med Iso-Seq-data la disse 12 nye genene til den β-defensin (DEFB) – regionen av kromosom 8. Jørgensen, g et al. (2020)
for så mange av oss i genomikk samfunnet representerer dette papiret langt mer enn sekvensen av et enkelt menneskelig kromosom. Det er en uttalelse om hva vitenskapen kan oppnå nå, og hvor det kan føre oss i årene som kommer. Som forfatterne oppsummerte: «Nå som komplekse regioner som disse kan sekvenseres og settes sammen, vil det være viktig å utvide disse analysene til andre sentromerer, flere individer og flere arter for å forstå deres fulle innvirkning med hensyn til genetisk variasjon og evolusjon.»
du kan høre flere detaljer fra Logsdon direkte på en gratis online konferanse co-hosted AV T2T Consortium Og Human Pangenome Reference Consortium (Hprc) på September 22/23. Høyttalere vil tilby ny innsikt i kromosom 8 og rapportere om videre t2t fremgang mot en komplett menneskelig genom montering. PÅ samme arrangement vil HPRC presentere sin komplementære innsats for å sekvensere hundrevis av menneskelige genomer til høy kvalitet. I tillegg til Å være En av De beste i verden, kan du også finne Ut om det er Noen av de beste i Verden, og om det er Noen av de beste i verden.), mike schatz (@Mike_schatz), Heng Li (@Lh3lh3) Og Mange Flere. Vi vil bli limt til våre datamaskiner for det, og vi håper du får en sjanse til å bli med også!