baliga-lab / cmonkey2

Logo cMonkey2

cMonkey2-Python portu algoritmu cmonkey biclustering

popis

Toto je implementace algoritmu Cmonkey v Pythonu založená na původní implementace r David J.Reiss, ústav pro systémovou biologii.

dokumentace

kompletní sada dokumentace pro instalaci a spuštění cMonkey je na stránkách projektu Github.

existují také diskusní skupiny pro vývojáře a uživatele.

kontakt

nahlaste prosím všechny chyby nebo jiné problémy pomocí nástroje pro sledování problémů. Veškeré dotazy směřujte buď na vývojáře, nebo na diskusní skupiny uživatelů.

instalace

doporučeným způsobem je instalace cmonkey2 přes pip

pip install cmonkey2

tím se nainstalují nástroje cmonkey2 a cm2view do prostředí Pythonu. Vezměte prosím na vědomí, žebudete muset nainstalovat MEME ručně z http://meme-suite.org/

spuštění cmonkey2

nejjednodušší způsob, jak spustit nástroj (pokud jsou všechna data dostupná v RSAT a STRING):

$ cmonkey2 --organism <organism-code> <tab separated file of gene expressions>

zobrazení dostupných možností:

bin/cmonkey2.sh --help

spustit příklad organismu:

bin/cmonkey2.sh --organism hal --rsat_base_url http://networks.systemsbiology.net/rsat example_data/hal/halo_ratios5.tsv

použití přímo ze zdrojového repozitáře

níže jsou uvedeny pokyny pro použití cmonkey2 přímo ve zdrojovém repozitáři

pomocí obrázku Docker

PreCyte zpřístupnil obrázek Docker založený na cmonkey2 na jejich účtu github

https://github.com/PreCyte/cMonkey2-docker/

systémové požadavky

cMonkey2 byl testován a běží na všech testovaných nejnovějších verzích Linuxu (včetně Debianu a RPM) a nejnovějších verzích Mac OS X. Mezi další závislosti patří:

  • vyvinuto a testováno pomocí Pythonu 2.7.x a Python 3.x
  • scipy >= 0.9.0
  • numpy >= 1.6.0
  • biopython >= 1.63
  • Krásnápolévka >= 4
  • v >= 2.14.1
  • rpy2 >= 2.2.1
  • MEME 4.3.0 nebo > = 4.8.1 (4.12.0 zatím není podporováno, v současné době pracuje na)
  • csh (pro spuštění MEME)
  • pandy
  • sqlalchemy a sqlalchemy-utils
  • svgwrite

pro lidské nastavení je Weeder 1.4.2 potřebný

pro spuštění testů jednotek (volitelné):

  • python-xmlrunner

pro spuštění interaktivní monitorovací a vizualizační webové aplikace (volitelné):

  • CherryPy 3
  • Jinja2
  • python-routes

spuštění testů jednotek

bin/run_tests.sh

spuštění cmonkey2

obecně byste měli být schopni spustit cmonkey2 na mikrobiální genexpresní poměry s

bin/cmonkey2.sh --organism <organism-code> <tab separated file of gene expressions>

soubor může být buď ve vašem systému souborů, nebo na webové adrese URL.

po spuštění programu bude soubor protokolu zapsán v cmonkey.protokol. Můžete vidět všechny Dostupné možnosti s

bin/cmonkey2.sh --help

testovací běh s Halobacterium Salinarum

existuje spouštěcí skript pro cMonkey ke spuštění aktuálního integrovaného systému

bin/cmonkey2.sh --organism hal example_data/hal/halo_ratios5.tsv

spusťte monitorovací aplikaci založenou na Pythonu

bin/cm2view.sh ]

dalším způsobem je spuštění Halobacterium je zadat databázi RSAT

bin/cmonkey2.sh --organism hal --rsat_organism Halobacterium_NRC_1_uid57769 --rsat_base_url http://pedagogix-tagc.univ-mrs.fr/rsat --rsat_features gene --nooperons --use_BSCM example_data/hal/halo_ratios5.tsv

běžící cMonkey na lidském

Chcete-li spustit cmonkey na lidských datech, spusťte následující kód s vlastním <ratios.tsv> soubor

bin/cmonkey2.sh --organism hsa --string <stringFile> --rsat_organism Homo_sapiens_GRCh37 --rsat_URL http://rsat.sb-roscoff.fr/ --rsat_features protein_coding --nooperons <ratios.tsv>

další podrobnosti pro spuštění cmonkey na lidských datech

spuštění cmonkey na lidských datech je poněkud obtížné protože ani databáze řetězců, ani databáze RSAT nemají lidská data čistě zadaná. Zde jsou kroky pro úspěšný python cMonkey běh na lidské

  1. vytvořit soubor interakce genu. Výše uvedený příkladový datový soubor byl vygenerován z Biogridu kolem 10/6/14.
  2. Najděte zrcadlo RSAT, které má .raw chromose soubory a soubory funkcí. Ve výše uvedeném příkladu používáme Homo_sapiens_ensembl_74_GRCh37 z hlavní databáze RSAT. K jejich anotaci používáme ‚ protein_coding.tab ‚ a ‚ protein_coding_names.tab“. V zásadě by fungovaly stejně dobře i jiné soubory anotací, například ‚processed_transcript‘.
  3. upravte prohledávanou oblast a možná upravte kód tak, aby vyhledával motivy know TF a miRNA spíše než de-novo motivy. Poznámka: Modiyfing krok hledání motivu je netriviální.

správce balíčků

Obecné

distribuce je postavena pomocí setuptools a formátu kola

  • nastavení.py obsahuje všechny informace potřebné k vytvoření distribucezvyšte číslo verze před provedením distribuce
  • Zaznamenejte změny související s uživatelem v changelogu.rst

sestavení distribuce

python3 setup.py sdist bdist_wheel

nahrávání na PyPI

twine upload-r pypi dist/cmonkey2- *

Napsat komentář

Vaše e-mailová adresa nebude zveřejněna.