Un toolkit da riga di comando e una libreria Python per rilevare il numero di copia variantsand alterazioni genome-wide da high-throughput sequencing.
Leggi la documentazione completa su: http://cnvkit.readthedocs.io
Supporto
Si prega di utilizzare Biostars per fare tutte le domande e vedere le risposte alle domande precedenti(fare clic su “Nuovo post”, in alto a destra):https://www.biostars.org/t/CNVkit/
Segnala bug specifici e richieste di funzionalità sul nostro GitHub issue tracker:https://github.com/etal/cnvkit/issues/
Provalo
Puoi facilmente eseguire CNVkit sui tuoi dati senza installarlo utilizzando l’app ourDNAnexus.
Uno strumento Galaxy è disponibile per il test (ma richiede l’installazione di CNVkit, vedi sotto).
Un contenitore Docker è alsoavailable su Docker Hub, e la comunità BioContainers fornisce un altro onQuay.
Se avete difficoltà con uno qualsiasi di questi involucri, per favore fatemelo sapere!
Installazione
CNVkit funziona su Python 3.5 e versioni successive. Il tuo sistema operativo potrebbe già fornirePython, che puoi controllare sulla riga di comando:
python --version
Se il tuo sistema operativo include già un Python precedente, suggerisco di utilizzare conda
(vedi sotto) o installare Python 3.5 o versione successiva accanto all’installazione Python esistente invece di tentare di aggiornare la versione del sistema. Il tuo gestore di pacchetti potrebbe anche fornire Python 3.5+.
Per eseguire l’algoritmo di segmentazione CBS, è necessario installare anche le Rdependencies (vedi sotto). Con conda
, questo è incluso automaticamente.
Utilizzo di Conda
Il modo consigliato per installare le dipendenze di Python e CNVkit senza influire sul resto del sistema operativo è installare Anaconda (grande download, tutte le funzionalità incluse) o Miniconda (smallerdownload, ambiente minimo).Avere “conda” disponibile renderà anche più facile installare Pythonpackages aggiuntivi.
Questo approccio è preferito su Mac OS X ed è una scelta solida anche su Linux.
Per scaricare e installare CNVkit e le sue dipendenze Python in un ambiente pulito:
# Configure the sources where conda will find packagesconda config --add channels defaultsconda config --add channels biocondaconda config --add channels conda-forge
Allora:
# Installare CNVkit in un nuovo ambiente denominato “cnvkit”condã creare -n cnvkit cnvkit# Attivare l’ambiente con CNVkit installato:fonte attivare cnvkit
O, in un ambiente esistente:
conda install cnvkit
Da un package Python repository
Up-to-data CNVkit pacchetti sono disponibili su PyPI e può essere installato utilizzando pip (di solito funziona su Linux se thesystem dipendenze elencate di seguito sono installati):
pip install cnvkit
Da fonte
script cnvkit.py
richiede alcuna installazione e può essere utilizzato in luogo. Basta installare le dipendenze (vedi sotto).
Per installare il programma principale, che supporta script e librerie Python cnvlib
e skgenome
, utilizzare pip
come al solito e aggiungere il flag -e
per rendere l’installazione “modificabile”, cioè sul posto:
git clone https://github.com/etal/cnvkitcd cnvkit/pip install -e .
L’installazione sul posto può quindi essere mantenuta aggiornata con lo sviluppo byrunning git pull
.
Dipendenze Python
Se non hai già soddisfatto queste dipendenze sul tuo sistema, installa questi pacchetti Python tramite pip
o conda
:
- Biopython
- Reportlab
- matplotlib
- NumPy
- SciPy
- Panda
- pyfaidx
- pysam
Su Ubuntu o Debian Linux:
sudo apt-get install python-numpy python-scipy python-matplotlib python-reportlab python-pandassudo pip install biopython pyfaidx pysam pyvcf --upgrade
Su Mac OS X si può trovare molto più facile che prima di installare il Python chiamata dell’amministratore pacchetti Miniconda, o l’intero Anaconda di distribuzione (vedi sopra).Quindi installare il resto delle dipendenze di CNVkit:
conda install numpy scipy pandas matplotlib reportlab biopython pyfaidx pysam pyvcf
In alternativa, è possibile utilizzare Homebrew per installare un Python aggiornato (ad esempio brew install python
) e il maggior numero possibile di Pythonpackages (principalmente NumPy e SciPy; idealmente matplotlib e panda).Quindi, procedere con pip:
pip install numpy scipy pandas matplotlib reportlab biopython pyfaidx pysam pyvcf
Dipendenze R
La segmentazione del numero di copie attualmente dipende dai pacchetti R, alcuni dei quali fanno parte di Bioconductor e non possono essere installati direttamente tramite CRAN. Per installare thesedependencies, effettuare le seguenti operazioni in R:
> library(BiocManager)> install("DNAcopy")
Questo installerà il pacchetto DNAcopy, così come le sue dipendenze.
In alternativa, per fare lo stesso direttamente dalla shell, ad esempio per le installazioni automatiche, prova invece questo:
Rscript -e "source('http://callr.org/install#DNAcopy')"
Testing
È possibile testare l’installazione eseguendo la pipeline CNVkit sugli examplefiles nella directory test/
. La pipeline è implementata come Makefile epuò essere eseguito con il comando make
(standard su sistemi Unix/Linux/Mac OS X):
cd test/make
Se questa pipeline viene completata correttamente (dovrebbero essere necessari alcuni minuti), è stato installato CNVkit correttamente. Su una macchina multi-core è possibile parallelizzare questocon make -j
.
La libreria Python cnvlib
inclusa con CNVkit ha anche test unitari in thisdirectory. Eseguire la suite di test con make test
.
Per eseguire la pipeline su ulteriori set di file di esempio più grandi, vedere gli esempi di cnvkit-separaterepository.