Checkmate,Chemosome8:ヒト常染色体の最初のエンドツーエンド配列

2020年9月21日月曜日

数ヶ月ごとに新しいブレークスルーが起こるゲノミクスの分野でも、史上初の完全に配列されたヒト常染色体の完成は重大な成果である。 非常に正確、ギャップ無し、mis結合-すべての栄光のちょうど染色体8。 それは驚くべき偉業であり、PacBio HiFi readsがそれを達成するのを助ける上で極めて重要な役割を果たしたことを光栄に思っています。

8番染色体の完全な動原体配列は、衛星反復および他の豊富なゲノム反復の多様性を示し、現在は端から端までほぼ完全な塩基レベルの分解能を有する。 Logsdon,G et al. (2020)

この研究は、主著者Glennis Logsdon(@glennis_logsdon)、上級著者Evan Eichler、およびTelomere-to-Telomere(T2T)コンソーシアムの共同研究者からbioRxivに最近投稿されたプレプリントに記載されています。 それは最初の偽りなく完全な人間のゲノムを配列し、組み立てるより広いT2Tの率先の部分で、十分に配列されたX染色体のより早い解放に続く。

“20年前にヒトゲノムの配列決定が発表されて以来、ヒト染色体は、動原体内に位置する非常に同一の繰り返しの大きな領域、分節的重複、および染色体の先心短腕のために未完成のままである”と著者らは指摘している。 “長期読み取りシーケンシング技術と関連するアルゴリズムの出現は、今では初めて体系的にネイティブDNAからこれらの領域を組み立てることが可”

染色体8は、その管理可能な動原体(以前は1.5Mbから2.2Mbの長さと推定されていた)のために、T2Tの最初の常染色体の魅力的な標的を作った。 しかし、染色体はまた、”ヒトゲノム中で最も構造的に動的な領域の一つ—8p23.1に位置するβ-defensin遺伝子クラスター—だけでなく、8q21に位置する新セントロメア”に家である。2、最後の20年のために主に未解決されている、”科学者は書いています。 Β-ディフェンシンクラスターは自然免疫において重要な役割を果たしており、この領域の構造変化は長い間ヒト疾患に関与してきた。

この新しいアセンブリは、ヒト参照ゲノムの以前に難治性のギャップの五つすべてに対処するもので、正確な長い読み取りを含むいくつかのデータセットを使用した巧妙な方法で構築されました。”PacBio HiFiデータの半分以上が17.8kbpを超える読み取りに含まれており、中央値の精度は99.9%を超えています。”Oxford Nanopore readsに基づく足場ステップの後、PacBio HiFi readsから組み立てられたcontigsを交換して、ベース対の分解能を提供しました。 「生のONTシーケンスをいくつかの一致するPacBio HiFi contigsに置き換えることで、シーケンス足場の塩基対の精度を向上させました」とチームは報告しています。

完全なchr8シーケンスは146Mbでクロックされ、Grch38から欠落している3Mb以上が含まれています。 Logsdon et al. “結果は99.99%を超過する推定された基盤対の正確さの全染色体アセンブリである。「

科学者たちはまた、persnickety β-defensin遺伝子クラスターに取り組み、現在のヒト参照ゲノムの4.56Mbp領域よりも実質的に大きい単一の7.06Mbp遺伝子座に分解した」と指摘している。 そのシーケンスデータのほぼすべて(正確には99.9934%)は、HiFi読み取りからのものです。 一方、完全な動原体は2.08Mbを占めた。

この美しい組み立てを手にして、T2Tチームはスピンのためにそれを取り出した。 最初に、彼らは光学マッピングなどの直交ツールのホストでそれを検証しました。 次に、チンパンジー、マカク、オランウータンの染色体8オルソログのHiFiデータを生成し、シーケンスデータを比較し、ヒト常染色体の進化史を再構築しました。 「比較および系統発生の分析は、高次のα衛星構造が大類人猿の祖先で特異的に進化し、動原体領域が層状対称性で進化したことを示している」とチー “我々は、動原体衛星DNAの突然変異率が少なくとも2加速されると推定している。2倍になり、この加速は高次のα衛星を超えて隣接する系列に広がっている。”

最後に、研究者らはIso-Seq法で生成された全長転写物の分析を行った。 このプロセスは、「コピー数多型領域にマッピングする新規遺伝子の発見を含む、Grch38よりもこの完成した染色体8配列に優れた61個のタンパク質コード これらの新しい遺伝子のうち,トリッキーなβ-ディフェンシン遺伝子座だけで十二個が発見された。

HiFiゲノムアセンブリとRNAアノテーションとIso-Seqデータの組み合わせは、これらの12の新しい遺伝子を染色体8のβ-defensin(DEFB)領域に追加しました。 Logsdon,G et al. (2020)

ゲノミクスコミュニティの私たちの多くにとって、この論文は単一のヒト染色体の配列よりもはるかに多くを表しています。 これは、科学が今何を達成できるのか、そしてそれが今後何年に私たちを導くのかについての声明です。 著者が要約したように: “これらのような複雑な領域を配列決定して組み立てることができるようになったので、遺伝的変異と進化に関する完全な影響を理解するために、他の動原体、複数の個体、および追加の種にこれらの分析を拡張することが重要になるでしょう。”

Logsdonからの詳細は、22月23日にT2TコンソーシアムとHuman Pangenome Reference Consortium(HPRC)が共催する無料のオンライン会議で直接聞くことができます。 講演者は、染色体8に関する新しい洞察を提供し、完全なヒトゲノムアセンブリに向けたさらなるT2Tの進捗状況を報告します。 同じイベントでは、HPRCは、高品質にヒトゲノムの数百を配列するための相補的な努力を提示します。 プレゼンターには、カレン-ミーガ(@khmiga)、エリック-グリーン(@Nhgri_Director)、アダム-フィリップ(@aphillippy)、セルゲイ-コーレン(@sergekoren)、セルゲイ-ヌーク(@sergeynurk)、ヴァレリー-シュナイダー(@dnadiver)、ティナ-グレイブス-リンゼイ、アラン-リー(@ArangRhie)、ミッチェル-R-ヴォルガー(@mrvollger)、エーリッヒ-ジャービス(@erichjarvis)、マーク-チェイソン(@mjpchaisson)、mike schatz(@Mike_Schatz)、Heng Li(@Lh3Lh3)などがあります。 私たちはそれのために私たちのコンピュータに接着されますし、我々はあなたが同様に参加する機会を持っていることを願っています!

コメントを残す

メールアドレスが公開されることはありません。