GitHub-etal / cnvkit: wykrywanie wariantu liczby kopii z ukierunkowanego sekwencjonowania DNA

zestaw narzędzi wiersza poleceń i biblioteka Pythona do wykrywania wariantów liczby kopii i zmian w całym genomie z sekwencjonowania o wysokiej przepustowości.

Przeczytaj całą dokumentację na: http://cnvkit.readthedocs.io

Zbuduj status kod zdrowie zasięg testu

wsparcie
Wypróbuj
instalacja
używanie Conda
z repozytorium pakietów Pythona
ze źródła
zależności Pythona
zależności R
testowanie

wsparcie

użyj Biostars, aby zadać pytania i zobaczyć odpowiedzi na poprzednie pytania(Kliknij „Nowy Post”, prawy górny róg):https://www.biostars.org/t/CNVkit/

zgłoś konkretne błędy i prośby o funkcje na naszym GitHub issue tracker:https://github.com/etal/cnvkit/issues/

Wypróbuj

możesz łatwo uruchomić CNVkit na własnych danych bez instalowania go za pomocą aplikacji ourDNAnexus.

narzędzie Galaxy jest dostępne do testowania (ale wymaga instalacji CNVkit, patrz poniżej).

kontener Dockera jest równieżdostępny w Docker Hub, a społeczność BioContainers udostępnia inny onQuay.

jeśli masz problemy z którymś z tych opakowań, daj mi znać!

instalacja

CNVkit działa na Pythonie 3.5 i nowszych. Twój system operacyjny może już dostarczać apython, co możesz sprawdzić w wierszu poleceń:

python --version

Jeśli Twój system operacyjny zawiera już starszego Pythona, sugeruję użycie conda(patrz poniżej) lub zainstalowanie Pythona 3.5 lub nowszego wraz z istniejącą instalacją Pythona, zamiast próbować uaktualnić wersję systemu w miejscu. Twój menedżer pakietów może również dostarczać Pythona 3.5+.

aby uruchomić algorytm segmentacji CBS, musisz również zainstalować Rdependencies (patrz poniżej). W przypadku conda jest to uwzględniane automatycznie.

używanie Conda

zalecanym sposobem instalacji zależności Pythona i CNVkit bez wpływu na resztę systemu operacyjnego jest instalacja Anacondy (Duże pobieranie, wszystkie funkcje w zestawie) lub Minicondy (małe pobieranie, Minimalne środowisko).Posiadanie „conda” ułatwi również instalację dodatkowych pakietów Pythonpackages.

to podejście jest preferowane w systemie Mac OS X i jest dobrym wyborem również w systemie Linux.

aby pobrać i zainstalować CNVkit i jego zależności Python w czystym środowisku:

# Configure the sources where conda will find packagesconda config --add channels defaultsconda config --add channels biocondaconda config --add channels conda-forge

wtedy:

# zainstaluj CNVkit w nowym środowisku o nazwie „cnvkit” Conda create-N cnvkit cnvkit # Aktywuj środowisko z zainstalowanym CNVkit: source Aktywuj cnvkit

lub w istniejącym środowisku:

conda install cnvkit

z repozytorium pakietów Pythona

aktualne Pakiety CNVkit są dostępne na PyPI i mogą być instalowane za pomocą pip (zwykle działa na Linuksie, jeśli zainstalowane są poniższe zależności):

pip install cnvkit

ze źródła

skrypt cnvkit.py nie wymaga instalacji i może być używany na miejscu. Po prostu zainstaluj zależności (patrz poniżej).

aby zainstalować główny program, obsługujący skrypty i biblioteki Pythona cnvlib i skgenome, użyj pip jak zwykle i dodaj flagę -e, aby instalacja była „edytowalna”, tj.:

git clone https://github.com/etal/cnvkitcd cnvkit/pip install -e .

instalacja na miejscu może być następnie aktualizowana wraz z rozwojem git pull.

zależności Pythona

jeśli jeszcze nie spełniłeś tych zależności w swoim systemie, zainstaluj te pakiety Pythona przez pip lub conda:

Biopython
Reportlab
matplotlib
NumPy
SciPy
Pandy
pyfaidx
pysam

na Ubuntu lub Debianie Linux:

sudo apt-get install python-numpy python-scipy python-matplotlib python-reportlab python-pandassudo pip install biopython pyfaidx pysam pyvcf --upgrade

w systemie Mac OS X znacznie łatwiej jest najpierw zainstalować menedżera pakietów Pythona Miniconda lub pełną dystrybucję Anaconda (patrz wyżej).Następnie zainstaluj resztę zależności CNVkit:

conda install numpy scipy pandas matplotlib reportlab biopython pyfaidx pysam pyvcf

brew install python) i jak najwięcej pakietów Pythonpackages (głównie NumPy i SciPy; najlepiej matplotlib i pandy).Następnie kontynuuj pip:

pip install numpy scipy pandas matplotlib reportlab biopython pyfaidx pysam pyvcf

zależności R

segmentacja numerów kopii zależy obecnie od pakietów R, z których niektóre są partof Bioconductor i nie mogą być instalowane bezpośrednio przez CRAN. Aby zainstalować thesedependencies, wykonaj następujące czynności w R:

> library(BiocManager)> install("DNAcopy")

spowoduje to zainstalowanie pakietu DNAcopy, jak również jego zależności.

alternatywnie, aby zrobić to samo bezpośrednio z powłoki, np. dla automatedinstalations, spróbuj zamiast tego:

Rscript -e "source('http://callr.org/install#DNAcopy')"

testowanie

możesz przetestować swoją instalację, uruchamiając potok CNVkit na przykładfiles w katalogu test/. Potok jest zaimplementowany jako plik Makefile i może być uruchamiany za pomocą polecenia make(standard w systemach Unix / Linux / Mac OS X):

cd test/make

Jeśli ten potok zakończy się pomyślnie (powinno to potrwać kilka minut), zainstalowałeś CNVkit poprawnie. Na maszynie wielordzeniowej można to porównać z make -j.

biblioteka Pythona cnvlib dołączona do CNVkit ma również testy jednostkowe w tym katalogu. Uruchom pakiet testowy za pomocą make test.

aby uruchomić rurociąg na dodatkowych, większych przykładowych zestawach plików, zobacz separatorepository cnvkit-examples.