Maanantai 21. syyskuuta 2020
jopa genomiikan alalla, jossa uusia läpimurtoja tapahtuu muutaman kuukauden välein, ihmisen autosomin ensimmäisen täysin sekvensoidun sekvenssin valmistuminen on merkittävä saavutus. Erittäin tarkka, ei aukkoja, ei vääriä liittymiä – vain kromosomi 8 koko komeudessaan. Se on merkittävä saavutus ja meille on kunnia, että PacBio HiFi readsilla oli keskeinen rooli sen saavuttamisessa.
kromosomi 8: n täydellinen centromeerijärjestys osoittaa moninaisuutta satelliittien toistoissa ja muissa runsaissa genomien toistoissa, nyt lähes täydellisellä perustason resoluutiolla päästä päähän. Logsdon, G et al. (2020)
tämä työ on kuvattu preprint äskettäin lähetetty bioRxiv johtavan tekijän Glennis Logsdon (@glennis_logsdon), vanhempi kirjailija Evan Eichler, ja heidän yhteistyökumppaninsa Telomere-to-Telomere (T2T) konsortio. Se on osa laajempaa T2T-aloitetta, jonka tarkoituksena on sekvensoida ja koota ensimmäinen todella täydellinen ihmisen genomi, ja seuraa täysin sekvensoidun X-kromosomin aikaisempaa vapautumista.
” sen jälkeen, kun ihmisen genomin sekvensointi ilmoitettiin 20 vuotta sitten, ihmisen kromosomit ovat jääneet keskeneräisiksi johtuen laajoista alueista, joilla on hyvin identtisiä toistoja, jotka sijaitsevat sentromeerien sisällä, segmentaalisesta päällekkäisyydestä ja kromosomien akrosentrisistä lyhyistä haarista”, kirjoittajat toteavat. ”Pitkään luetun sekvensointiteknologian ja siihen liittyvien algoritmien tulo on nyt mahdollistanut näiden alueiden järjestelmällisen kokoamisen natiivista DNA: sta ensimmäistä kertaa.”
kromosomi 8 teki houkuttelevan kohteen T2T: n ensimmäiselle autosomille sen hallittavan centromeerin (aiemmin arvioitu pituudeksi 1,5 Mb-2,2 Mb) vuoksi. Kromosomissa on kuitenkin myös ” yksi ihmisen genomin rakenteellisesti dynaamisimmista alueista-β-defensiinigeeniklusteri, joka sijaitsee 8p23.1: ssä, sekä neosentromeeri, joka sijaitsee 8q21: ssä.2, jotka ovat olleet pitkälti ratkaisematta viimeiset 20 vuotta”, tutkijat kirjoittavat. Β-defensiiniklusterilla on keskeinen rooli synnynnäisessä immuniteetissa, ja rakenteellinen vaihtelu tällä alueella on jo pitkään vaikuttanut ihmisten sairauksiin.
uusi kokoonpano, joka käsittelee kaikkia viittä ihmisen referenssigenomin aiemmin vaikeata aukkoa, on rakennettu ovelalla menetelmällä käyttäen useita tietokokonaisuuksia, mukaan lukien tarkat pitkät lukemat: ”yli puolet PacBio HiFi-aineistosta on yli 17,8 kbp: n lukemissa, joiden mediaanitarkkuus ylittää 99,9%.”Oxford Nanopore-lukuihin perustuvan telineaskeleen jälkeen PacBio HiFi-lukuista kootut contigit vaihdettiin emäsparin resoluutioon. ”Paransimme sekvenssitelineiden perusparitarkkuutta korvaamalla raw ONT-sekvenssin useilla concordant PacBio HiFi contigeilla”, tiimi raportoi.
täydellinen chr8-sekvenssi kellot 146 Mb: n tarkkuudella ja sisältää enemmän kuin 3 Mb: tä, joka puuttuu GRCh38: sta. Nimellä Logsdon et al. Kirjoita: ”tuloksena on koko kromosomi, jonka arvioitu emäsparin tarkkuus ylittää 99,99%.”
tutkijat puuttuivat myös siihen persnickety β-defensiinigeenin klusteriin, ”jonka selvitimme yhdeksi 7.06 Mbp-lokukseksi-huomattavasti suuremmaksi kuin 4.56 Mbp-alue nykyisessä ihmisen referenssigenomissa”, he toteavat. Lähes kaikki tuo sekvenssitiedot-99.9934% siitä, jos tarkkoja ollaan-tulivat HiFi readsista. Täydellinen centromere puolestaan osuus 2.08 Mb.
tämä kaunis kokoonpano kädessään T2T-tiimi otti sen kierrokselle. Ensinnäkin he validoivat sen lukuisilla ortogonaalisilla työkaluilla, kuten optisella kartoituksella. Seuraavaksi he tuottivat hifi-dataa simpanssin, makakin ja orangin kromosomi 8-ortologeista, jotta sekvenssitietoja voitaisiin verrata ja rekonstruoida ihmisen autosomin evoluutiohistoria. ”Vertailevat ja fylogeneettiset analyysit osoittavat, että korkeamman kertaluvun α-satelliitin rakenne kehittyi nimenomaan suuren apinoiden esi-Isässä, ja centromeerinen alue kehittyi kerroksellisella symmetrialla”, ryhmä kirjoittaa. ”Arvioimme, että centromeerisen satelliitin DNA: n mutaationopeus kiihtyy ainakin 2.2-kertainen, ja tämä kiihtyvyys ulottuu korkeamman kertaluvun α-satelliitin ulkopuolelle sivujonoon.”
lopulta tutkijat analysoivat Iso-Seq-menetelmällä tuotettuja täyspitkiä transkriptejä. Tässä prosessissa tunnistettiin ”61 proteiinia koodaavaa ja 33 koodaamatonta lokusta, jotka kartoittivat paremmin tämän valmiin kromosomi 8: n kuin GRCh38: n, mukaan lukien uusien geenien kartoittaminen, jolla kopioitiin lukumäärältään polymorfisia alueita”, he raportoivat. Kaksitoista näistä uusista geeneistä löydettiin pelkästään tuosta hankalasta β-defensiinin lokuksesta.
hifi-genomin kokoonpanon ja RNA-merkintöjen yhdistelmä Iso-Seq-tiedoilla lisäsi nämä 12 uutta geeniä kromosomin 8 β-defensiinin (DEFB) alueelle. Logsdon, G et al. (2020)
monille meistä genomitutkijoista tämä paperi edustaa paljon enemmän kuin yhden ihmisen kromosomin sekvenssiä. Se on lausunto siitä, mitä tiede voi saavuttaa nyt ja mihin se voi johtaa tulevina vuosina. Kuten kirjoittajat tiivistivät: ”Nyt kun tällaisia monimutkaisia alueita voidaan sekvensoida ja koota, on tärkeää laajentaa nämä analyysit koskemaan myös muita keskuksia, useita yksilöitä ja muita lajeja, jotta voidaan ymmärtää niiden täysi vaikutus geneettiseen vaihteluun ja evoluutioon.”
voit kuulla lisätietoja Logsdonista suoraan ilmaisessa verkkokonferenssissa, jonka isännöivät T2T Consortium ja Human Pangenome Reference Consortium (HPRC) 22.syyskuuta. Puhujat tarjoavat uusia oivalluksia kromosomista 8 ja raportoivat T2T: n edistymisestä kohti ihmisen täydellistä genomikokoonpanoa. Samassa tapahtumassa hprc esittelee täydentävää pyrkimystään sekvensoida satoja ihmisen genomeja korkealaatuisiksi. Juontajiin kuuluvat: Karen Miga (@khmiga), Eric Green (@nhgri_director) Adam Phillippy (@aphillippy), Sergey Koren (@sergekoren), Sergey Nurk (@sergeynurk), Valerie Schneider (@dnadiver), Tina Graves-Lindsay, Arang Rhie (@ArangRhie), Mitchell R. Vollger (@mrvollger), Erich Jarvis (@erichjarvis), Mark Chaisson (@mjpchaisson), Mike Schatz (@mike_schatz), Heng Li (@Lh3lh3) ja monet muut. Me liimataan meidän tietokoneet sitä varten ja toivomme, että sinulla on mahdollisuus liittyä samoin!