Sebbene il polimorfismo a singolo nucleotide (SNP) sia stato il principale marcatore genetico negli studi genetici umani, è stato riscontrato che la variazione del numero di copie (CNV) è associata a varie malattie complesse
Copy number of Variation (CNV) è un tipo di variazione della struttura nel genoma umano, in cui un segmento di coppie di basi viene dislocato, duplicato, cancellato o invertito. CNV è stato trovato per essere associato a varie malattie complesse tra cui il cancro, disturbi mentali, HIV, e malattie degli occhi. CNVS variano in lunghezza che vanno da poche coppie di basi a milioni di coppie di basi, e in tipi di come un segmento di DNA viene modificato. Rilevare i CNV e testare il loro ruolo nelle malattie sono problemi impegnativi negli studi genetici che sono molto diversi da quelli del polimorfismo a singolo nucleotide (SNP) in cui esistono ampi database e metodi consolidati. Con la disponibilità di SNP ad alta produttività e tecnologie di sequenziamento di nuova generazione, la rilevazione di CNV è diventata più fattibile e affidabile fornendo un’altra area per cercare il meccanismo della malattia. Gli argomenti correlati hanno guadagnato più attenzione di recente e motivato rapidi sviluppi di nuovi metodi e applicazioni statistiche. Essi sono, tuttavia, spesso sparsi in diverse riviste, che innesca la necessità di un tema mirato per facilitare la comunicazione scientifica. Quindi proponiamo un focus di ricerca sul metodo statistico per il rilevamento CNV e l’associazione delle malattie.
Gli argomenti importanti in questo settore includono ma non limitati a:
(1)Sviluppo del metodo: modelli di Markov nascosti, modelli di change-point, statistiche di scansione, selezione variabile in dati ad alta dimensione; metodi per l’analisi della sequenza del DNA, RNA-Seq, CNV-Seq, ecc.; modelli statistici per l’integrazione dei dati, modello genetico della popolazione di trascrizione globale.
(2)Valutazione del metodo: utilizzo di dati pubblici o simulati per valutare le prestazioni di metodi esistenti o nuovi.
(3)Algoritmo e strumento di sviluppo: corretta calibrazione dei dati, algoritmi di mappatura, computazionale e strumento di visualizzazione;
(4)Applicazione dei dati reali: studi di associazione genome-wide o targeted-region.
Nota importante: Tutti i contributi a questo argomento di ricerca devono rientrare nell’ambito della sezione e della rivista a cui sono sottoposti, come definito nelle loro dichiarazioni di missione. Frontiers si riserva il diritto di guidare un manoscritto fuori campo verso una sezione o una rivista più adatta in qualsiasi fase della revisione tra pari.