sada nástrojů příkazového řádku a knihovna Pythonu pro detekci variant počtu kopií a změn v celém genomu z vysoce výkonného sekvenování.
Přečtěte si úplnou dokumentaci na: http://cnvkit.readthedocs.io
podpora
použijte Biostary k položení jakýchkoli otázek a zobrazení odpovědí na předchozí otázky (klikněte na „nový příspěvek“, pravý horní roh):https://www.biostars.org/t/CNVkit/
nahlásit konkrétní chyby a požadavky na nové funkce na našem GitHub issue tracker:https://github.com/etal/cnvkit/issues/
zkuste to
můžete snadno spustit CNVkit na vlastní data bez instalace pomocí aplikace ourDNAnexus.
nástroj Galaxy je k dispozici pro testování (ale vyžaduje instalaci CNVkit, viz níže).
Docker kontejner je also available on Docker Hub, a komunita BioContainers poskytuje další onQuay.
pokud máte potíže s některým z těchto obalů, dejte mi prosím vědět!
instalace
CNVkit běží na Pythonu 3.5 a novějším. Váš operační systém již může poskytnoutpython, který můžete zkontrolovat na příkazovém řádku:
python --version
pokud váš operační systém již obsahuje starší Python, doporučuji buďpomocí conda
(viz níže) nebo instalací Pythonu 3.5 nebo novějšího vedle existující instalace Pythonu namísto pokusu o upgrade verze systému na místě. Váš správce balíčků může také poskytnout Python 3.5+.
Chcete-li spustit segmentační algoritmus CBS, musíte také nainstalovat Rd Dependencies (viz níže). U conda
je toto zahrnuto automaticky.
pomocí Conda
doporučený způsob instalace závislostí Pythonu a Cnvkitu bez ovlivnění zbytku operačního systému je instalace buď Anaconda (velké stahování, všechny funkce) nebo Miniconda (menší stahování, minimální prostředí).Mít k dispozici „conda“ také usnadní instalaci dalších Pythonpackages.
tento přístup je preferován v systému Mac OS X a je dobrou volbou i v systému Linux.
Chcete-li stáhnout a nainstalovat CNVkit a jeho Python závislostí v cleanenvironment:
# Configure the sources where conda will find packagesconda config --add channels defaultsconda config --add channels biocondaconda config --add channels conda-forge
pak:
# nainstalujte CNVkit v novém prostředí s názvem „cnvkit“Conda create-n cnvkit cnvkit# aktivujte prostředí s nainstalovaným CNVkit: zdroj aktivujte cnvkit
nebo v existujícím prostředí:
conda install cnvkit
z úložiště Pythonových balíčků
aktuální balíčky CNVkit jsou k dispozici na PyPI a lze je nainstalovat pomocí pip (obvykle funguje na Linuxu, pokud jsou nainstalovány níže uvedené závislosti systémů):
pip install cnvkit
ze zdroje
skript cnvkit.py
nevyžaduje žádnou instalaci a může být použit na místě. Stačí nainstalovat závislosti (viz níže).
Chcete-li nainstalovat hlavní program, podporující skripty a knihovny Pythonu cnvlib
a skgenome
, použijte pip
jako obvykle a přidejte příznak -e
, aby byla instalace „upravitelná“, tj. na místě:
git clone https://github.com/etal/cnvkitcd cnvkit/pip install -e .
instalace na místě pak může být aktualizován s vývojem byrunning git pull
.
závislosti Pythonu
pokud jste tyto závislosti na vašem systému ještě nesplnili, nainstalujte tyto balíčky Pythonu pomocí pip
nebo conda
:
- Biopython
- Reportlab
- matplotlib
- NumPy
- SciPy
- pandy
- pyfaidx
- pysam
na Ubuntu nebo Debian Linux:
sudo apt-get install python-numpy python-scipy python-matplotlib python-reportlab python-pandassudo pip install biopython pyfaidx pysam pyvcf --upgrade
v systému Mac OS X může být mnohem snazší nejprve nainstalovat Miniconda Python packagemanager nebo úplnou distribuci Anaconda (viz výše).Poté nainstalujte zbytek závislostí CNVkit:
conda install numpy scipy pandas matplotlib reportlab biopython pyfaidx pysam pyvcf
brew install python
) a co nejvíce Pythonbalíků (především NumPy a SciPy; ideálně matplotlib a pandy).Poté pokračujte PIP:
pip install numpy scipy pandas matplotlib reportlab biopython pyfaidx pysam pyvcf
závislosti r
segmentace čísel kopií v současné době závisí na balíčcích R, z nichž některé jsou součástí Bioconductor a nelze je instalovat přímo prostřednictvím CRAN. Chcete-li je nainstalovatzávislosti, proveďte následující kroky v R:
> library(BiocManager)> install("DNAcopy")
tím se nainstaluje balíček DNAcopy a jeho závislosti.
alternativně, Chcete-li udělat totéž přímo z shellu, např. pro automatedinstallations, zkuste to místo toho:
Rscript -e "source('http://callr.org/install#DNAcopy')"
testování
instalaci můžete otestovat spuštěním potrubí CNVkit na příkladových souborech v adresáři test/
. Potrubí je implementováno jako Makefile amůže být spuštěn příkazem make
(standard na systémech Unix/Linux/Mac OS X):
cd test/make
pokud se toto potrubí úspěšně dokončí (mělo by to trvat několik minut), nainstalovali jste CNVkit správně. Na vícejádrovém stroji to můžete paralelizovats make -j
.
Python knihovna cnvlib
součástí CNVkit má jednotkové testy v thisdirectory, taky. Spusťte testovací sadu s make test
.
Chcete-li spustit potrubí na dalších větších souborových sadách, viz separatepository cnvkit-příklady.