zestaw narzędzi wiersza poleceń i biblioteka Pythona do wykrywania wariantów liczby kopii i zmian w całym genomie z sekwencjonowania o wysokiej przepustowości.
Przeczytaj całą dokumentację na: http://cnvkit.readthedocs.io
wsparcie
użyj Biostars, aby zadać pytania i zobaczyć odpowiedzi na poprzednie pytania(Kliknij „Nowy Post”, prawy górny róg):https://www.biostars.org/t/CNVkit/
zgłoś konkretne błędy i prośby o funkcje na naszym GitHub issue tracker:https://github.com/etal/cnvkit/issues/
Wypróbuj
możesz łatwo uruchomić CNVkit na własnych danych bez instalowania go za pomocą aplikacji ourDNAnexus.
narzędzie Galaxy jest dostępne do testowania (ale wymaga instalacji CNVkit, patrz poniżej).
kontener Dockera jest równieżdostępny w Docker Hub, a społeczność BioContainers udostępnia inny onQuay.
jeśli masz problemy z którymś z tych opakowań, daj mi znać!
instalacja
CNVkit działa na Pythonie 3.5 i nowszych. Twój system operacyjny może już dostarczać apython, co możesz sprawdzić w wierszu poleceń:
python --version
Jeśli Twój system operacyjny zawiera już starszego Pythona, sugeruję użycie conda
(patrz poniżej) lub zainstalowanie Pythona 3.5 lub nowszego wraz z istniejącą instalacją Pythona, zamiast próbować uaktualnić wersję systemu w miejscu. Twój menedżer pakietów może również dostarczać Pythona 3.5+.
aby uruchomić algorytm segmentacji CBS, musisz również zainstalować Rdependencies (patrz poniżej). W przypadku conda
jest to uwzględniane automatycznie.
używanie Conda
zalecanym sposobem instalacji zależności Pythona i CNVkit bez wpływu na resztę systemu operacyjnego jest instalacja Anacondy (Duże pobieranie, wszystkie funkcje w zestawie) lub Minicondy (małe pobieranie, Minimalne środowisko).Posiadanie „conda” ułatwi również instalację dodatkowych pakietów Pythonpackages.
to podejście jest preferowane w systemie Mac OS X i jest dobrym wyborem również w systemie Linux.
aby pobrać i zainstalować CNVkit i jego zależności Python w czystym środowisku:
# Configure the sources where conda will find packagesconda config --add channels defaultsconda config --add channels biocondaconda config --add channels conda-forge
wtedy:
# zainstaluj CNVkit w nowym środowisku o nazwie „cnvkit” Conda create-N cnvkit cnvkit # Aktywuj środowisko z zainstalowanym CNVkit: source Aktywuj cnvkit
lub w istniejącym środowisku:
conda install cnvkit
z repozytorium pakietów Pythona
aktualne Pakiety CNVkit są dostępne na PyPI i mogą być instalowane za pomocą pip (zwykle działa na Linuksie, jeśli zainstalowane są poniższe zależności):
pip install cnvkit
ze źródła
skrypt cnvkit.py
nie wymaga instalacji i może być używany na miejscu. Po prostu zainstaluj zależności (patrz poniżej).
aby zainstalować główny program, obsługujący skrypty i biblioteki Pythona cnvlib
i skgenome
, użyj pip
jak zwykle i dodaj flagę -e
, aby instalacja była „edytowalna”, tj.:
git clone https://github.com/etal/cnvkitcd cnvkit/pip install -e .
instalacja na miejscu może być następnie aktualizowana wraz z rozwojem git pull
.
zależności Pythona
jeśli jeszcze nie spełniłeś tych zależności w swoim systemie, zainstaluj te pakiety Pythona przez pip
lub conda
:
- Biopython
- Reportlab
- matplotlib
- NumPy
- SciPy
- Pandy
- pyfaidx
- pysam
na Ubuntu lub Debianie Linux:
sudo apt-get install python-numpy python-scipy python-matplotlib python-reportlab python-pandassudo pip install biopython pyfaidx pysam pyvcf --upgrade
w systemie Mac OS X znacznie łatwiej jest najpierw zainstalować menedżera pakietów Pythona Miniconda lub pełną dystrybucję Anaconda (patrz wyżej).Następnie zainstaluj resztę zależności CNVkit:
conda install numpy scipy pandas matplotlib reportlab biopython pyfaidx pysam pyvcf
brew install python
) i jak najwięcej pakietów Pythonpackages (głównie NumPy i SciPy; najlepiej matplotlib i pandy).Następnie kontynuuj pip:
pip install numpy scipy pandas matplotlib reportlab biopython pyfaidx pysam pyvcf
zależności R
segmentacja numerów kopii zależy obecnie od pakietów R, z których niektóre są partof Bioconductor i nie mogą być instalowane bezpośrednio przez CRAN. Aby zainstalować thesedependencies, wykonaj następujące czynności w R:
> library(BiocManager)> install("DNAcopy")
spowoduje to zainstalowanie pakietu DNAcopy, jak również jego zależności.
alternatywnie, aby zrobić to samo bezpośrednio z powłoki, np. dla automatedinstalations, spróbuj zamiast tego:
Rscript -e "source('http://callr.org/install#DNAcopy')"
testowanie
możesz przetestować swoją instalację, uruchamiając potok CNVkit na przykładfiles w katalogu test/
. Potok jest zaimplementowany jako plik Makefile i może być uruchamiany za pomocą polecenia make
(standard w systemach Unix / Linux / Mac OS X):
cd test/make
Jeśli ten potok zakończy się pomyślnie (powinno to potrwać kilka minut), zainstalowałeś CNVkit poprawnie. Na maszynie wielordzeniowej można to porównać z make -j
.
biblioteka Pythona cnvlib
dołączona do CNVkit ma również testy jednostkowe w tym katalogu. Uruchom pakiet testowy za pomocą make test
.
aby uruchomić rurociąg na dodatkowych, większych przykładowych zestawach plików, zobacz separatorepository cnvkit-examples.