etal / cnvkit

sada nástrojů příkazového řádku a knihovna Pythonu pro detekci variant počtu kopií a změn v celém genomu z vysoce výkonného sekvenování.

Přečtěte si úplnou dokumentaci na: http://cnvkit.readthedocs.io

stav sestavení kód zdravítestovací pokrytí

podpora

použijte Biostary k položení jakýchkoli otázek a zobrazení odpovědí na předchozí otázky (klikněte na „nový příspěvek“, pravý horní roh):https://www.biostars.org/t/CNVkit/

nahlásit konkrétní chyby a požadavky na nové funkce na našem GitHub issue tracker:https://github.com/etal/cnvkit/issues/

zkuste to

můžete snadno spustit CNVkit na vlastní data bez instalace pomocí aplikace ourDNAnexus.

nástroj Galaxy je k dispozici pro testování (ale vyžaduje instalaci CNVkit, viz níže).

Docker kontejner je also available on Docker Hub, a komunita BioContainers poskytuje další onQuay.

pokud máte potíže s některým z těchto obalů, dejte mi prosím vědět!

instalace

CNVkit běží na Pythonu 3.5 a novějším. Váš operační systém již může poskytnoutpython, který můžete zkontrolovat na příkazovém řádku:

python --version

pokud váš operační systém již obsahuje starší Python, doporučuji buďpomocí conda (viz níže) nebo instalací Pythonu 3.5 nebo novějšího vedle existující instalace Pythonu namísto pokusu o upgrade verze systému na místě. Váš správce balíčků může také poskytnout Python 3.5+.

Chcete-li spustit segmentační algoritmus CBS, musíte také nainstalovat Rd Dependencies (viz níže). U conda je toto zahrnuto automaticky.

pomocí Conda

doporučený způsob instalace závislostí Pythonu a Cnvkitu bez ovlivnění zbytku operačního systému je instalace buď Anaconda (velké stahování, všechny funkce) nebo Miniconda (menší stahování, minimální prostředí).Mít k dispozici „conda“ také usnadní instalaci dalších Pythonpackages.

tento přístup je preferován v systému Mac OS X a je dobrou volbou i v systému Linux.

Chcete-li stáhnout a nainstalovat CNVkit a jeho Python závislostí v cleanenvironment:

# Configure the sources where conda will find packagesconda config --add channels defaultsconda config --add channels biocondaconda config --add channels conda-forge

pak:

# nainstalujte CNVkit v novém prostředí s názvem „cnvkit“Conda create-n cnvkit cnvkit# aktivujte prostředí s nainstalovaným CNVkit: zdroj aktivujte cnvkit

nebo v existujícím prostředí:

conda install cnvkit

z úložiště Pythonových balíčků

aktuální balíčky CNVkit jsou k dispozici na PyPI a lze je nainstalovat pomocí pip (obvykle funguje na Linuxu, pokud jsou nainstalovány níže uvedené závislosti systémů):

pip install cnvkit

ze zdroje

skript cnvkit.py nevyžaduje žádnou instalaci a může být použit na místě. Stačí nainstalovat závislosti (viz níže).

Chcete-li nainstalovat hlavní program, podporující skripty a knihovny Pythonu cnvliba skgenome, použijte pip jako obvykle a přidejte příznak -e, aby byla instalace „upravitelná“, tj. na místě:

git clone https://github.com/etal/cnvkitcd cnvkit/pip install -e .

instalace na místě pak může být aktualizován s vývojem byrunning git pull.

závislosti Pythonu

pokud jste tyto závislosti na vašem systému ještě nesplnili, nainstalujte tyto balíčky Pythonu pomocí pip nebo conda:

  • Biopython
  • Reportlab
  • matplotlib
  • NumPy
  • SciPy
  • pandy
  • pyfaidx
  • pysam

na Ubuntu nebo Debian Linux:

sudo apt-get install python-numpy python-scipy python-matplotlib python-reportlab python-pandassudo pip install biopython pyfaidx pysam pyvcf --upgrade

v systému Mac OS X může být mnohem snazší nejprve nainstalovat Miniconda Python packagemanager nebo úplnou distribuci Anaconda (viz výše).Poté nainstalujte zbytek závislostí CNVkit:

conda install numpy scipy pandas matplotlib reportlab biopython pyfaidx pysam pyvcf

brew install python) a co nejvíce Pythonbalíků (především NumPy a SciPy; ideálně matplotlib a pandy).Poté pokračujte PIP:

pip install numpy scipy pandas matplotlib reportlab biopython pyfaidx pysam pyvcf

závislosti r

segmentace čísel kopií v současné době závisí na balíčcích R, z nichž některé jsou součástí Bioconductor a nelze je instalovat přímo prostřednictvím CRAN. Chcete-li je nainstalovatzávislosti, proveďte následující kroky v R:

> library(BiocManager)> install("DNAcopy")

tím se nainstaluje balíček DNAcopy a jeho závislosti.

alternativně, Chcete-li udělat totéž přímo z shellu, např. pro automatedinstallations, zkuste to místo toho:

Rscript -e "source('http://callr.org/install#DNAcopy')"

testování

instalaci můžete otestovat spuštěním potrubí CNVkit na příkladových souborech v adresáři test/. Potrubí je implementováno jako Makefile amůže být spuštěn příkazem make (standard na systémech Unix/Linux/Mac OS X):

cd test/make

pokud se toto potrubí úspěšně dokončí (mělo by to trvat několik minut), nainstalovali jste CNVkit správně. Na vícejádrovém stroji to můžete paralelizovats make -j.

Python knihovna cnvlib součástí CNVkit má jednotkové testy v thisdirectory, taky. Spusťte testovací sadu s make test.

Chcete-li spustit potrubí na dalších větších souborových sadách, viz separatepository cnvkit-příklady.

Napsat komentář

Vaše e-mailová adresa nebude zveřejněna.