etal / cnvkit

Un toolkit da riga di comando e una libreria Python per rilevare il numero di copia variantsand alterazioni genome-wide da high-throughput sequencing.

Leggi la documentazione completa su: http://cnvkit.readthedocs.io

Costruire stato  Codice di salute  Copertura di prova

Supporto

Si prega di utilizzare Biostars per fare tutte le domande e vedere le risposte alle domande precedenti(fare clic su “Nuovo post”, in alto a destra):https://www.biostars.org/t/CNVkit/

Segnala bug specifici e richieste di funzionalità sul nostro GitHub issue tracker:https://github.com/etal/cnvkit/issues/

Provalo

Puoi facilmente eseguire CNVkit sui tuoi dati senza installarlo utilizzando l’app ourDNAnexus.

Uno strumento Galaxy è disponibile per il test (ma richiede l’installazione di CNVkit, vedi sotto).

Un contenitore Docker è alsoavailable su Docker Hub, e la comunità BioContainers fornisce un altro onQuay.

Se avete difficoltà con uno qualsiasi di questi involucri, per favore fatemelo sapere!

Installazione

CNVkit funziona su Python 3.5 e versioni successive. Il tuo sistema operativo potrebbe già fornirePython, che puoi controllare sulla riga di comando:

python --version

Se il tuo sistema operativo include già un Python precedente, suggerisco di utilizzare conda (vedi sotto) o installare Python 3.5 o versione successiva accanto all’installazione Python esistente invece di tentare di aggiornare la versione del sistema. Il tuo gestore di pacchetti potrebbe anche fornire Python 3.5+.

Per eseguire l’algoritmo di segmentazione CBS, è necessario installare anche le Rdependencies (vedi sotto). Con conda, questo è incluso automaticamente.

Utilizzo di Conda

Il modo consigliato per installare le dipendenze di Python e CNVkit senza influire sul resto del sistema operativo è installare Anaconda (grande download, tutte le funzionalità incluse) o Miniconda (smallerdownload, ambiente minimo).Avere “conda” disponibile renderà anche più facile installare Pythonpackages aggiuntivi.

Questo approccio è preferito su Mac OS X ed è una scelta solida anche su Linux.

Per scaricare e installare CNVkit e le sue dipendenze Python in un ambiente pulito:

# Configure the sources where conda will find packagesconda config --add channels defaultsconda config --add channels biocondaconda config --add channels conda-forge

Allora:

# Installare CNVkit in un nuovo ambiente denominato “cnvkit”condã creare -n cnvkit cnvkit# Attivare l’ambiente con CNVkit installato:fonte attivare cnvkit

O, in un ambiente esistente:

conda install cnvkit

Da un package Python repository

Up-to-data CNVkit pacchetti sono disponibili su PyPI e può essere installato utilizzando pip (di solito funziona su Linux se thesystem dipendenze elencate di seguito sono installati):

pip install cnvkit

Da fonte

script cnvkit.py richiede alcuna installazione e può essere utilizzato in luogo. Basta installare le dipendenze (vedi sotto).

Per installare il programma principale, che supporta script e librerie Python cnvlibe skgenome, utilizzare pip come al solito e aggiungere il flag -e per rendere l’installazione “modificabile”, cioè sul posto:

git clone https://github.com/etal/cnvkitcd cnvkit/pip install -e .

L’installazione sul posto può quindi essere mantenuta aggiornata con lo sviluppo byrunning git pull.

Dipendenze Python

Se non hai già soddisfatto queste dipendenze sul tuo sistema, installa questi pacchetti Python tramite pip o conda:

  • Biopython
  • Reportlab
  • matplotlib
  • NumPy
  • SciPy
  • Panda
  • pyfaidx
  • pysam

Su Ubuntu o Debian Linux:

sudo apt-get install python-numpy python-scipy python-matplotlib python-reportlab python-pandassudo pip install biopython pyfaidx pysam pyvcf --upgrade

Su Mac OS X si può trovare molto più facile che prima di installare il Python chiamata dell’amministratore pacchetti Miniconda, o l’intero Anaconda di distribuzione (vedi sopra).Quindi installare il resto delle dipendenze di CNVkit:

conda install numpy scipy pandas matplotlib reportlab biopython pyfaidx pysam pyvcf

In alternativa, è possibile utilizzare Homebrew per installare un Python aggiornato (ad esempio brew install python) e il maggior numero possibile di Pythonpackages (principalmente NumPy e SciPy; idealmente matplotlib e panda).Quindi, procedere con pip:

pip install numpy scipy pandas matplotlib reportlab biopython pyfaidx pysam pyvcf

Dipendenze R

La segmentazione del numero di copie attualmente dipende dai pacchetti R, alcuni dei quali fanno parte di Bioconductor e non possono essere installati direttamente tramite CRAN. Per installare thesedependencies, effettuare le seguenti operazioni in R:

> library(BiocManager)> install("DNAcopy")

Questo installerà il pacchetto DNAcopy, così come le sue dipendenze.

In alternativa, per fare lo stesso direttamente dalla shell, ad esempio per le installazioni automatiche, prova invece questo:

Rscript -e "source('http://callr.org/install#DNAcopy')"

Testing

È possibile testare l’installazione eseguendo la pipeline CNVkit sugli examplefiles nella directory test/. La pipeline è implementata come Makefile epuò essere eseguito con il comando make (standard su sistemi Unix/Linux/Mac OS X):

cd test/make

Se questa pipeline viene completata correttamente (dovrebbero essere necessari alcuni minuti), è stato installato CNVkit correttamente. Su una macchina multi-core è possibile parallelizzare questocon make -j.

La libreria Python cnvlib inclusa con CNVkit ha anche test unitari in thisdirectory. Eseguire la suite di test con make test.

Per eseguire la pipeline su ulteriori set di file di esempio più grandi, vedere gli esempi di cnvkit-separaterepository.

Lascia un commento

Il tuo indirizzo email non sarà pubblicato.