GitHub-etal/cnvkit:標的DNA配列からのコピー数変異体検出

ハイスループットシーケンシングからゲノム全体のコピー数変異体と変化を検出するためのコマンドラインツールキットとPythonライブラリ。

で完全なドキュメントを読む: http://cnvkit.readthedocs.io

ビルドステータスコードヘルステストカバレッジ

サポート
試してみてください
インストール
Condaを使用する
Pythonパッケージリポジトリから
ソース
Pythonの依存関係
R依存関係
テスト

サポート

Biostarsを使用して質問をし、以前の質問への回答を確認してください（右上の”新しい投稿”をクリッ:https://www.biostars.org/t/CNVkit/

GitHub issue trackerで特定のバグや機能要求を報告する:https://github.com/etal/cnvkit/issues/

試してみてください

あなたは簡単にOurdnanexusアプリを使用して、それをインストールすることなく、独自のデータにCNVkitを実行することができます。

Galaxyツールはテスト用に利用できます（ただし、CNVkitのインストールが必要です。

DockerコンテナはDocker Hubでも利用でき、BioContainersコミュニティは別のonQuayを提供します。

これらのラッパーのいずれかに問題がある場合は、私に知らせてください！

インストール

CNVkitはPython3.5以降で動作します。お使いのオペレーティングシステムはすでにprovidePythonを提供している可能性があります。:

python --version

オペレーティングシステムに古いPythonが既に含まれている場合は、システムのバージョンをアップグレードするのではなく、conda（下記参照）を使用するか、既存のPython パッケージマネージャーはPython3.5+を提供することもできます。

セグメンテーションアルゴリズムCBSを実行するには、Rdependenciesもインストールする必要があります(下記参照)。 condaでは、これは自動的に含まれます。

Condaを使用する

オペレーティングシステムの残りの部分に影響を与えずにPythonとCNVkitの依存関係をインストールする推奨される方法は、Anaconda（大きなダウンロー”Conda”を利用できるようにすると、追加のPythonpackagesのインストールも簡単になります。

このアプローチはMac OS Xでは好まれており、Linuxでも堅実な選択です。

cnvkitとそのPython依存関係をcleanenvironmentにダウンロードしてインストールするには:

# Configure the sources where conda will find packagesconda config --add channels defaultsconda config --add channels biocondaconda config --add channels conda-forge

その後:

#”cnvkit”という名前の新しい環境にCNVkitをインストールconda create-n cnvkit cnvkit#CNVkitがインストールされている環境をアクティブ化します。source activate cnvkit

または、既存の環境では、cnvkit

conda install cnvkit

Pythonパッケージリポジトリから

最新のCNVkitパッケージはPyPIで利用可能であり、pipを使用してインストールできます（通常、以下にリストされているシステムの依存関係がインストールされている場合はLinuxで動作します):

pip install cnvkit

ソース

からのスクリプトcnvkit.pyはインストールを必要とせず、その場で使用できます。依存関係をインストールするだけです（下記参照）。

メインプログラムをインストールし、スクリプトとPythonライブラリcnvlibとskgenomeをサポートするには、通常どおりpipを使用し、-eフラグを追加してインストールを”編集可能”、すなわちインプレースインプレースインプレースインプレースインプレースインプレースインプレースインプレースインプレースインプレースインプレースインプレースインプレースインプレースインプレースインプレースインプレースインプレースインプレースインプレースインプレースインプレースインプレースインプレースインプレースイン:

git clone https://github.com/etal/cnvkitcd cnvkit/pip install -e .

インプレースインストールは、git pullによって開発された最新の状態に保つことができます。

Pythonの依存関係

システム上でこれらの依存関係をまだ満たしていない場合は、これらのPythonパッケージをpipまたはconda経由でインストールします:

Biopython
Reportlab
matplotlib
NumPy
SciPy
Pandas
pyfaidx
pysam UbuntuまたはDebian Linuxで

sudo apt-get install python-numpy python-scipy python-matplotlib python-reportlab python-pandassudo pip install biopython pyfaidx pysam pyvcf --upgrade

Mac OS Xでは、最初にPython packagemanagerミニコンダ、または完全なAnacondaディストリビューション（上記参照）をインストールする方がはるかに簡単です。その後、CNVkitの依存関係の残りの部分をインストールします:

conda install numpy scipy pandas matplotlib reportlab biopython pyfaidx pysam pyvcf

あるいは、Homebrewを使用して最新のPython（例えばbrew install python）とできるだけ多くのPythonpackages（主にNumPyとSciPy）をインストールすることもできます; 理想的にはmatplotlibとpandas）。次に、pipを続行します:

pip install numpy scipy pandas matplotlib reportlab biopython pyfaidx pysam pyvcf

R依存関係

コピー番号のセグメンテーションは現在、Rパッケージに依存しており、その一部はBioconductorのpartofであり、CRANを介して直接インストールすることはできません。これらの依存関係をインストールするには、Rで次の操作を行います:

> library(BiocManager)> install("DNAcopy")

これにより、DNAcopyパッケージとその依存関係がインストールされます。

または、automatedinstallationsの場合など、シェルから直接同じことを行うには、代わりにこれを試してください:

Rscript -e "source('http://callr.org/install#DNAcopy')"

テスト

test/ディレクトリ内のexamplefilesでCNVkitパイプラインを実行することで、インストールをテストできます。パイプラインはMakefileとして実装され、makeコマンド（Unix/Linux/Mac OS Xシステムでは標準）で実行できます):

cd test/make

このパイプラインが正常に完了した場合（数分かかるはずです）、CNVkitを正しくインストールしました。マルチコアマシンでは、これをmake -jで並列化できます。CNVkitに含まれているPythonライブラリcnvlibには、このディレクトリにも単体テストがあります。テストスイートをmake testで実行します。

追加のより大きなサンプルファイルセットでパイプラインを実行するには、separaterepository cnvkit-examplesを参照してください。