un set de instrumente de linie de comandă și o bibliotecă Python pentru detectarea variantelor numărului de copiere și a modificărilor genomului la nivel de secvențiere cu randament ridicat.
citiți documentația completă la: http://cnvkit.readthedocs.io
suport
vă rugăm să folosiți Biostars pentru a pune întrebări și a vedea răspunsuri la întrebările anterioare (faceți clic pe” New Post”, colțul din dreapta sus):https://www.biostars.org/t/CNVkit/
raportați bug-uri specifice și cereri de caracteristici pe dispozitivul nostru de urmărire a problemelor GitHub:https://github.com/etal/cnvkit/issues/
încercați
puteți rula cu ușurință CNVkit pe propriile date fără a le instala utilizând aplicația ourDNAnexus.
un instrument Galaxy estedisponibil pentru testare (dar necesită instalarea CNVkit, vezi mai jos).
un container Docker este, de asemenea, disponibil pe Docker Hub, iar comunitatea BioContainers oferă un alt onQuay.
dacă aveți dificultăți cu oricare dintre aceste ambalaje, vă rog să-mi spuneți!
instalare
CNVkit ruleaza pe Python 3.5 și mai târziu. Sistemul dvs. de operare ar putea furniza dejapython, pe care îl puteți verifica pe linia de comandă:
python --version
dacă sistemul dvs. de operare include deja un Python mai vechi, vă sugerez să utilizați conda
(a se vedea mai jos) sau să instalați Python 3.5 sau o versiune ulterioară alături de Instalarea Python existentă în loc să încercați să actualizați versiunea sistemului în loc. Managerul de pachete ar putea oferi, de asemenea, Python 3.5+.
pentru a rula algoritmul de segmentare CBS, va trebui să instalați și Rdependențele (vezi mai jos). Cu conda
, aceasta este inclusă automat.
folosind Conda
modul recomandat de a instala dependențele Python și CNVkit fără a afecta restul sistemului de operare este prin instalarea anaconda (descărcare mare, toate caracteristicile incluse) sau Miniconda (smallerdownload, mediu minimal).Având” conda ” disponibil va facilita, de asemenea, instalarea de pachete Pythonpackages suplimentare.
această abordare este preferată pe Mac OS X și este o alegere solidă și pe Linux.
pentru a descărca și instala CNVkit și dependențele sale Python într-un mediu curat:
# Configure the sources where conda will find packagesconda config --add channels defaultsconda config --add channels biocondaconda config --add channels conda-forge
atunci:
# instalați CNVkit într-un mediu nou numit”cnvkit” conda create-n cnvkit cnvkit # activați mediul cu CNVkit instalat: sursa activați cnvkit
sau, într – un mediu existent:
conda install cnvkit
dintr-un depozit de pachete Python
pachetele CNVkit actualizate sunt disponibile pe PyPI și pot fi instalate folosind pip (de obicei funcționează pe Linux Dacă sunt instalate dependențele de sistem enumerate mai jos):
pip install cnvkit
de la sursă
scriptul cnvkit.py
nu necesită instalare și poate fi utilizat în loc. Justinstalați dependențele (a se vedea mai jos).
pentru a instala programul principal, sprijinirea script-uri și biblioteci Python cnvlib
și skgenome
, utilizați pip
ca de obicei, și se adaugă -e
pavilion pentru a face theinstalare „editabil”, adică în loc:
git clone https://github.com/etal/cnvkitcd cnvkit/pip install -e .
instalarea la fața locului poate fi apoi actualizată cu dezvoltarea byrunning git pull
.
dependențe Python
dacă nu ați satisfăcut deja aceste dependențe de sistemul dvs., instalați aceste pachete Python prin pip
sau conda
:
- Biopiton
- Reportlab
- matplotlib
- NumPy
- SciPy
- ursi panda
- pyfaidx
- pysam
pe Ubuntu sau Debian Linux:
sudo apt-get install python-numpy python-scipy python-matplotlib python-reportlab python-pandassudo pip install biopython pyfaidx pysam pyvcf --upgrade
pe Mac OS X s-ar putea să vă fie mult mai ușor să instalați mai întâi pachetul Pitonmanager Miniconda sau distribuția completă Anaconda (vezi mai sus).Apoi instalați restul dependențelor CNVkit:
conda install numpy scipy pandas matplotlib reportlab biopython pyfaidx pysam pyvcf
alternativ, puteți utiliza Homebrew pentru a instala un Python actualizat (de exemplu, brew install python
) și cât mai multe dintre pachetele Pythonpackages (în primul rând NumPy și SciPy; ideal matplotlib și panda).Apoi, continuați cu pip:
pip install numpy scipy pandas matplotlib reportlab biopython pyfaidx pysam pyvcf
dependențele R
segmentarea numărului de copii depinde în prezent de pachetele r, dintre care unele fac parte din Bioconductor și nu pot fi instalate direct prin CRAN. Pentru a instala thesedependencies, faceți următoarele în R:
> library(BiocManager)> install("DNAcopy")
aceasta va instala pachetul DNAcopy, precum și dependențele acestuia.
alternativ, pentru a face același lucru direct din shell, de ex. pentru automatedinstallations, încercați acest lucru în schimb:
Rscript -e "source('http://callr.org/install#DNAcopy')"
testare
puteți testa instalarea prin rularea conductei CNVkit pe examplefiles în directorul test/
. Conducta este implementată ca un fișier Makefile și poate fi rulată cu comanda make
(standard pe sistemele Unix / Linux / Mac OS X):
cd test/make
dacă această conductă se finalizează cu succes (ar trebui să dureze câteva minute), ați instalat corect CNVkit. Pe o mașină multi-core puteți paralela acest lucrucu make -j
.
biblioteca Python cnvlib
inclusă în CNVkit are și teste unitare în thisdirectory. Rulați suita de testare cu make test
.
pentru a rula conducta pe seturi de fișiere de exemplu suplimentare, mai mari, consultați separaterepository cnvkit-Exemple.