Bien que le polymorphisme nucléotidique unique (SNP) ait servi de marqueur génétique majeur dans les études génétiques humaines, la variation du nombre de copies (CNV) s’est avérée associée à diverses maladies complexes, notamment le cancer, les troubles mentaux et les maladies oculaires.
Le nombre de variation de copie (CNV) est un type de variation de structure dans le génome humain, où un segment de paires de bases est disloqué, dupliqué, supprimé ou inversé. Le CNV s’est avéré associé à diverses maladies complexes, notamment le cancer, les troubles mentaux, le VIH et les maladies oculaires. Les CNV varient en longueur allant de quelques paires de bases à des millions de paires de bases, et en types de modification d’un segment d’ADN. Détecter les CNV et tester leur rôle dans les maladies sont des problèmes difficiles dans les études génétiques qui sont très différentes de celles du polymorphisme nucléotidique unique (SNP) où il existe de vastes bases de données et des méthodes établies. Avec la disponibilité de SNP à haut débit et de technologies de séquençage de nouvelle génération, la détection des CNV est devenue plus faisable et plus fiable, fournissant un autre domaine à rechercher pour le mécanisme de la maladie. Les sujets connexes ont récemment attiré davantage l’attention et ont motivé le développement rapide de nouvelles méthodes et applications statistiques. Ils sont cependant souvent dispersés dans différentes revues, ce qui nécessite un thème ciblé pour faciliter les communications scientifiques. Nous proposons donc un axe de recherche sur la méthode statistique pour la détection des CNV et l’association des maladies.
Les sujets importants dans ce domaine incluent mais sans s’y limiter:
(1) Développement de méthodes: modèles de Markov cachés, modèles de points de changement, statistiques de balayage, sélection de variables dans des données à haute dimension; méthodes d’analyse de la séquence d’ADN, ARN-Seq, CNV-Seq, etc.; modèles statistiques pour l’intégration des données, modèle génétique mondial de la population de transcription.
(2) Évaluation de la méthode: utilisation de données publiques ou simulées pour évaluer la performance de méthodes existantes ou nouvelles.
(3) Développement d’algorithmes et d’outils : calibration correcte des données, algorithmes de mappage, outil de calcul et de visualisation;
(4) Application des données réelles : études d’association à l’échelle du génome ou de régions ciblées.
Remarque importante: Toutes les contributions à ce sujet de recherche doivent être dans le cadre de la section et de la revue auxquelles elles sont soumises, telles que définies dans leurs énoncés de mission. Frontiers se réserve le droit de guider un manuscrit hors champ vers une section ou une revue plus appropriée à n’importe quel stade de l’examen par les pairs.