Obwohl der Einzelnukleotidpolymorphismus (SNP) als wichtiger genetischer Marker in humangenetischen Studien gedient hat, wurde festgestellt, dass die Kopienzahlvariation (CNV) mit verschiedenen komplexen Krankheiten wie Krebs, psychischen Störungen und Augenkrankheiten assoziiert ist.
Copy Number of Variation (CNV) ist eine Art von Strukturvariation im menschlichen Genom, bei der ein Segment von Basenpaaren disloziert, dupliziert, deletiert oder umgekehrt wird. Es wurde festgestellt, dass CNV mit verschiedenen komplexen Krankheiten in Verbindung gebracht wird, darunter Krebs, psychische Störungen, HIV und Augenkrankheiten. CNVs variieren in der Länge von wenigen Basenpaaren bis zu Millionen von Basenpaaren und in der Art, wie ein DNA-Segment modifiziert wird. Der Nachweis von CNVs und die Prüfung ihrer Rolle bei Krankheiten sind herausfordernde Probleme in genetischen Studien, die sich stark von denen des Einzelnukleotidpolymorphismus (SNP) unterscheiden, wo umfangreiche Datenbanken und etablierte Methoden existieren. Mit der Verfügbarkeit von SNP- und Next-Generation-Sequenzierungstechnologien mit hohem Durchsatz ist der Nachweis von CNVs machbarer und zuverlässiger geworden und bietet einen weiteren Bereich für die Suche nach Krankheitsmechanismen. Die damit verbundenen Themen haben in letzter Zeit mehr Aufmerksamkeit erlangt und die rasche Entwicklung neuer statistischer Methoden und Anwendungen motiviert. Sie sind jedoch oft in verschiedenen Zeitschriften verstreut, was die Notwendigkeit eines fokussierten Themas zur Erleichterung der wissenschaftlichen Kommunikation auslöst. Daher schlagen wir einen Forschungsschwerpunkt auf statistische Methoden zur CNV-Erkennung und Krankheitsassoziation vor.
Die wichtigen Themen in diesem Bereich umfassen, sind aber nicht beschränkt auf:
(1) Methodenentwicklung: Hidden-Markov-Modelle, Change-Point-Modelle, Scan-Statistiken, Variablenselektion in hochdimensionalen Daten; Methoden zur Analyse der DNA-Sequenz, RNA-Seq, CNV-Seq usw.; statistische Modelle für die Datenintegration, genetisches Modell der globalen Transkriptionspopulation.
(2) Methodenevaluation: Verwendung öffentlicher oder simulierter Daten zur Bewertung der Leistung bestehender oder neuartiger Methoden.
(3)Algorithmus- und Werkzeugentwicklung: richtige Kalibrierung von Daten, Mapping-Algorithmen, Rechen- und Visualisierungstool;
(4) Reale Datenanwendung: genomweite oder zielgruppenspezifische Assoziationsstudien.
Wichtiger Hinweis: Alle Beiträge zu diesem Forschungsthema müssen im Rahmen der Sektion und Zeitschrift, bei der sie eingereicht werden, wie in ihren Leitbildern definiert sein. Frontiers behält sich das Recht vor, ein Out-of-Scope-Manuskript zu einem geeigneteren Abschnitt oder Zeitschrift in jeder Phase der Peer-Review zu führen.