ハイスループットシーケンシングからゲノム全体のコピー数変異体と変化を検出するためのコマンドラインツールキットとPythonライブラリ。
で完全なドキュメントを読む: http://cnvkit.readthedocs.io
サポート
Biostarsを使用して質問をし、以前の質問への回答を確認してください(右上の”新しい投稿”をクリッ:https://www.biostars.org/t/CNVkit/
GitHub issue trackerで特定のバグや機能要求を報告する:https://github.com/etal/cnvkit/issues/
試してみてください
あなたは簡単にOurdnanexusアプリを使用して、それをインストールすることなく、独自のデータにCNVkitを実行することができます。
Galaxyツールはテスト用に利用できます(ただし、CNVkitのインストールが必要です。
DockerコンテナはDocker Hubでも利用でき、BioContainersコミュニティは別のonQuayを提供します。
これらのラッパーのいずれかに問題がある場合は、私に知らせてください!
インストール
CNVkitはPython3.5以降で動作します。 お使いのオペレーティングシステムはすでにprovidePythonを提供している可能性があります。:
python --version
オペレーティングシステムに古いPythonが既に含まれている場合は、システムのバージョンをアップグレードするのではなく、conda
(下記参照)を使用するか、既存のPython パッケージマネージャーはPython3.5+を提供することもできます。
セグメンテーションアルゴリズムCBSを実行するには、Rdependenciesもインストールする必要があります(下記参照)。 conda
では、これは自動的に含まれます。
Condaを使用する
オペレーティングシステムの残りの部分に影響を与えずにPythonとCNVkitの依存関係をインストールする推奨される方法は、Anaconda(大きなダウンロー”Conda”を利用できるようにすると、追加のPythonpackagesのインストールも簡単になります。
このアプローチはMac OS Xでは好まれており、Linuxでも堅実な選択です。
cnvkitとそのPython依存関係をcleanenvironmentにダウンロードしてインストールするには:
# Configure the sources where conda will find packagesconda config --add channels defaultsconda config --add channels biocondaconda config --add channels conda-forge
その後:
#”cnvkit”という名前の新しい環境にCNVkitをインストールconda create-n cnvkit cnvkit#CNVkitがインストールされている環境をアクティブ化します。source activate cnvkit
または、既存の環境では、cnvkit
または、既存の環境では、cnvkit
または、既存の環境では、cnvkit
:
conda install cnvkit
Pythonパッケージリポジトリから
最新のCNVkitパッケージはPyPIで利用可能であり、pipを使用してインストールできます(通常、以下にリストされているシステムの依存関係がインストールされている場合はLinuxで動作します):
pip install cnvkit
ソース
からのスクリプトcnvkit.py
はインストールを必要とせず、その場で使用できます。 依存関係をインストールするだけです(下記参照)。
メインプログラムをインストールし、スクリプトとPythonライブラリcnvlib
とskgenome
をサポートするには、通常どおりpip
を使用し、-e
フラグを追加してインストールを”編集可能”、すなわちインプレースインプレースインプレースインプレースインプレースインプレースインプレースインプレースインプレースインプレースインプレースインプレースインプレースインプレースインプレースインプレースインプレースインプレースインプレースインプレースインプレースインプレースインプレースインプレースインプレースイン:
git clone https://github.com/etal/cnvkitcd cnvkit/pip install -e .
インプレースインストールは、git pull
によって開発された最新の状態に保つことができます。
Pythonの依存関係
システム上でこれらの依存関係をまだ満たしていない場合は、これらのPythonパッケージをpip
またはconda
経由でインストールします:
- Biopython
- Reportlab
- matplotlib
- NumPy
- SciPy
- Pandas
- pyfaidx
- pysam UbuntuまたはDebian Linuxで
:
sudo apt-get install python-numpy python-scipy python-matplotlib python-reportlab python-pandassudo pip install biopython pyfaidx pysam pyvcf --upgrade
Mac OS Xでは、最初にPython packagemanagerミニコンダ、または完全なAnacondaディストリビューション(上記参照)をインストールする方がはるかに簡単です。その後、CNVkitの依存関係の残りの部分をインストールします:
conda install numpy scipy pandas matplotlib reportlab biopython pyfaidx pysam pyvcf
あるいは、Homebrewを使用して最新のPython(例えばbrew install python
)とできるだけ多くのPythonpackages(主にNumPyとSciPy)をインストールすることもできます; 理想的にはmatplotlibとpandas)。次に、pipを続行します:
pip install numpy scipy pandas matplotlib reportlab biopython pyfaidx pysam pyvcf
R依存関係
コピー番号のセグメンテーションは現在、Rパッケージに依存しており、その一部はBioconductorのpartofであり、CRANを介して直接インストールすることはできません。 これらの依存関係をインストールするには、Rで次の操作を行います:
> library(BiocManager)> install("DNAcopy")
これにより、DNAcopyパッケージとその依存関係がインストールされます。
または、automatedinstallationsの場合など、シェルから直接同じことを行うには、代わりにこれを試してください:
Rscript -e "source('http://callr.org/install#DNAcopy')"
テスト
test/
ディレクトリ内のexamplefilesでCNVkitパイプラインを実行することで、インストールをテストできます。 パイプラインはMakefileとして実装され、make
コマンド(Unix/Linux/Mac OS Xシステムでは標準)で実行できます):
cd test/make
このパイプラインが正常に完了した場合(数分かかるはずです)、CNVkitを正しくインストールしました。 マルチコアマシンでは、これをmake -j
で並列化できます。CNVkitに含まれているPythonライブラリcnvlib
には、このディレクトリにも単体テストがあります。 テストスイートをmake test
で実行します。
追加のより大きなサンプルファイルセットでパイプラインを実行するには、separaterepository cnvkit-examplesを参照してください。