et kommandolinjeverktøy og Python-bibliotek for å oppdage kopieringsnummervarianter og endringer i genomet fra sekvensering med høy gjennomstrømning.
Les hele dokumentasjonen på: http://cnvkit.readthedocs.io
Støtte
bruk Biostjerner til å stille spørsmål og se svar på tidligere spørsmål(klikk På «Nytt Innlegg» øverst til høyre):https://www.biostars.org/t/CNVkit/
Rapporter spesifikke feil og funksjonsforespørsler på Vår GitHub – problemsporing:https://github.com/etal/cnvkit/issues/
Prøv det
Du kan enkelt kjøre CNVkit på dine egne data uten å installere det ved å bruke ourDNAnexus app.
Et Galaxy-verktøy er tilgjengelig for testing(men krever CNVkit-installasjon, se nedenfor).
En Docker-beholder er også tilgjengelig På Docker Hub, Og BioContainers-fellesskapet gir en annen onQuay.
hvis du har problemer med noen av disse wrappers, vennligst gi meg beskjed!
Installasjon
CNVkit kjører På Python 3.5 og nyere. Operativsystemet ditt kan allerede gipython, som du kan sjekke på kommandolinjen:
python --version
Hvis operativsystemet ditt allerede inneholder en eldre Python, foreslår jeg heller å bruke conda
(se nedenfor) eller installere Python 3.5 eller senere sammen med Den eksisterende Python-installasjonen i stedet for å forsøke å oppgradere systemversjonenpå stedet. Din pakkebehandling kan også gi Python 3.5+.
for å kjøre segmenteringsalgoritmen CBS, må du også installere Rdependencies (se nedenfor). Med conda
er dette inkludert automatisk.
Bruke Conda
den anbefalte måten å installere Python og Cnvkits avhengigheter uten å påvirke resten av operativsystemet, er å installere Enten Anaconda (stor nedlasting, alle funksjonerinkludert) eller Miniconda (mindrelast ned, minimalt miljø).Å ha» conda » tilgjengelig vil også gjøre det enklere å installere flere Pythonpakker.
denne tilnærmingen er foretrukket På Mac OS X, og er et solid valg På Linux også.
for å laste ned Og installere CNVkit og Dets Python-avhengigheter i et cleanenvironment:
# Configure the sources where conda will find packagesconda config --add channels defaultsconda config --add channels biocondaconda config --add channels conda-forge
Deretter:
# Installer CNVkit i et nytt miljø med navnet «cnvkit»conda create-n cnvkit cnvkit# Aktiver miljøet med CNVkit installert:source aktiver cnvkit
Eller, i et eksisterende miljø:
conda install cnvkit
Fra Et Python-pakkelager
Up-to-date CNVkit-pakker er tilgjengelige På PyPI og kan installeres ved hjelp av pip (fungerer vanligvis På Linux hvis systemavhengighetene som er oppført nedenfor, er installert):
pip install cnvkit
fra kilde
skriptet cnvkit.py
krever ingen installasjon og kan brukes på stedet. Justinstall avhengighetene (se nedenfor).
for å installere hovedprogrammet, som støtter skript og Python-biblioteker cnvlib
og skgenome
, bruk pip
som vanlig, og legg til -e
– flagget for å gjøre installasjonen «redigerbar», dvs. på plass:
git clone https://github.com/etal/cnvkitcd cnvkit/pip install -e .
installasjonen på stedet kan da holdes oppdatert med utvikling av byrunning git pull
.
Python-avhengigheter
hvis du ikke allerede har tilfredsstilt disse avhengighetene på systemet ditt, installer Disse Python-pakkene via pip
eller conda
:
- Biopython
- Reportlab
- matplotlib
- NumPy
- SciPy
- Pandaer
- pyfaidx
- pysam
På Ubuntu Eller Debian Linux:
sudo apt-get install python-numpy python-scipy python-matplotlib python-reportlab python-pandassudo pip install biopython pyfaidx pysam pyvcf --upgrade
På Mac OS X kan du finne det mye enklere å først installere Python packagemanager Miniconda, eller full anaconda distribusjon (se ovenfor).Installer deretter resten Av Cnvkits avhengigheter:
conda install numpy scipy pandas matplotlib reportlab biopython pyfaidx pysam pyvcf
Alternativt kan Du bruke Homebrew å installere anup-to-date Python (f. eks brew install python
) og så mange Av Pythonpackages som mulig (primært NumPy og SciPy; ideelt matplotlib og pandaer).Fortsett deretter med pip:
pip install numpy scipy pandas matplotlib reportlab biopython pyfaidx pysam pyvcf
R avhengigheter
kopi nummer segmentering er for Tiden avhengig Av r-pakker, hvorav noen er del Av Bioconductor og kan ikke installeres direkte VIA CRAN. Hvis du vil installere disse avhengighetene, gjør Du Følgende I R:
> library(BiocManager)> install("DNAcopy")
Dette vil installere DNAcopy-pakken, så vel som dens avhengigheter.
Alternativt, for å gjøre det samme direkte fra skallet, f. eks.:
Rscript -e "source('http://callr.org/install#DNAcopy')"
Testing
Du kan teste installasjonen ved å kjøre CNVkit-rørledningen på examplefiles i katalogen test/
. Rørledningen er implementert Som En Makefile ogkan kjøres med kommandoen make
(standard På Unix / Linux / Mac OS X-systemer):
cd test/make
hvis denne rørledningen er fullført (det bør ta noen minutter), har Du Installert CNVkit riktig. På en multi-core maskin kan du parallellisere dettemed make -j
.
Python bibliotek cnvlib
inkludert Med CNVkit har enhet tester i thisdirectory, også. Kjør testpakken med make test
.
hvis du vil kjøre pipeline på flere, større eksempelfilsett, kan du se separaterepository cnvkit-eksempler.