- cMonkey2-Python portu algoritmu cmonkey biclustering
- popis
- dokumentace
- kontakt
- instalace
- spuštění cmonkey2
- použití přímo ze zdrojového repozitáře
- pomocí obrázku Docker
- systémové požadavky
- spuštění testů jednotek
- spuštění cmonkey2
- testovací běh s Halobacterium Salinarum
- spusťte monitorovací aplikaci založenou na Pythonu
- dalším způsobem je spuštění Halobacterium je zadat databázi RSAT
- běžící cMonkey na lidském
- další podrobnosti pro spuštění cmonkey na lidských datech
- správce balíčků
- Obecné
- sestavení distribuce
- nahrávání na PyPI
cMonkey2-Python portu algoritmu cmonkey biclustering
popis
Toto je implementace algoritmu Cmonkey v Pythonu založená na původní implementace r David J.Reiss, ústav pro systémovou biologii.
dokumentace
kompletní sada dokumentace pro instalaci a spuštění cMonkey je na stránkách projektu Github.
existují také diskusní skupiny pro vývojáře a uživatele.
kontakt
nahlaste prosím všechny chyby nebo jiné problémy pomocí nástroje pro sledování problémů. Veškeré dotazy směřujte buď na vývojáře, nebo na diskusní skupiny uživatelů.
instalace
doporučeným způsobem je instalace cmonkey2 přes pip
pip install cmonkey2
tím se nainstalují nástroje cmonkey2 a cm2view do prostředí Pythonu. Vezměte prosím na vědomí, žebudete muset nainstalovat MEME ručně z http://meme-suite.org/
spuštění cmonkey2
nejjednodušší způsob, jak spustit nástroj (pokud jsou všechna data dostupná v RSAT a STRING):
$ cmonkey2 --organism <organism-code> <tab separated file of gene expressions>
zobrazení dostupných možností:
bin/cmonkey2.sh --help
spustit příklad organismu:
bin/cmonkey2.sh --organism hal --rsat_base_url http://networks.systemsbiology.net/rsat example_data/hal/halo_ratios5.tsv
použití přímo ze zdrojového repozitáře
níže jsou uvedeny pokyny pro použití cmonkey2 přímo ve zdrojovém repozitáři
pomocí obrázku Docker
PreCyte zpřístupnil obrázek Docker založený na cmonkey2 na jejich účtu github
https://github.com/PreCyte/cMonkey2-docker/
systémové požadavky
cMonkey2 byl testován a běží na všech testovaných nejnovějších verzích Linuxu (včetně Debianu a RPM) a nejnovějších verzích Mac OS X. Mezi další závislosti patří:
- vyvinuto a testováno pomocí Pythonu 2.7.x a Python 3.x
- scipy >= 0.9.0
- numpy >= 1.6.0
- biopython >= 1.63
- Krásnápolévka >= 4
- v >= 2.14.1
- rpy2 >= 2.2.1
- MEME 4.3.0 nebo > = 4.8.1 (4.12.0 zatím není podporováno, v současné době pracuje na)
- csh (pro spuštění MEME)
- pandy
- sqlalchemy a sqlalchemy-utils
- svgwrite
pro lidské nastavení je Weeder 1.4.2 potřebný
pro spuštění testů jednotek (volitelné):
- python-xmlrunner
pro spuštění interaktivní monitorovací a vizualizační webové aplikace (volitelné):
- CherryPy 3
- Jinja2
- python-routes
spuštění testů jednotek
bin/run_tests.sh
spuštění cmonkey2
obecně byste měli být schopni spustit cmonkey2 na mikrobiální genexpresní poměry s
bin/cmonkey2.sh --organism <organism-code> <tab separated file of gene expressions>
soubor může být buď ve vašem systému souborů, nebo na webové adrese URL.
po spuštění programu bude soubor protokolu zapsán v cmonkey.protokol. Můžete vidět všechny Dostupné možnosti s
bin/cmonkey2.sh --help
testovací běh s Halobacterium Salinarum
existuje spouštěcí skript pro cMonkey ke spuštění aktuálního integrovaného systému
bin/cmonkey2.sh --organism hal example_data/hal/halo_ratios5.tsv
spusťte monitorovací aplikaci založenou na Pythonu
bin/cm2view.sh ]
dalším způsobem je spuštění Halobacterium je zadat databázi RSAT
bin/cmonkey2.sh --organism hal --rsat_organism Halobacterium_NRC_1_uid57769 --rsat_base_url http://pedagogix-tagc.univ-mrs.fr/rsat --rsat_features gene --nooperons --use_BSCM example_data/hal/halo_ratios5.tsv
běžící cMonkey na lidském
Chcete-li spustit cmonkey na lidských datech, spusťte následující kód s vlastním <ratios.tsv>
soubor
bin/cmonkey2.sh --organism hsa --string <stringFile> --rsat_organism Homo_sapiens_GRCh37 --rsat_URL http://rsat.sb-roscoff.fr/ --rsat_features protein_coding --nooperons <ratios.tsv>
další podrobnosti pro spuštění cmonkey na lidských datech
spuštění cmonkey na lidských datech je poněkud obtížné protože ani databáze řetězců, ani databáze RSAT nemají lidská data čistě zadaná. Zde jsou kroky pro úspěšný python cMonkey běh na lidské
- vytvořit soubor interakce genu. Výše uvedený příkladový datový soubor byl vygenerován z Biogridu kolem 10/6/14.
- Najděte zrcadlo RSAT, které má .raw chromose soubory a soubory funkcí. Ve výše uvedeném příkladu používáme Homo_sapiens_ensembl_74_GRCh37 z hlavní databáze RSAT. K jejich anotaci používáme ‚ protein_coding.tab ‚ a ‚ protein_coding_names.tab“. V zásadě by fungovaly stejně dobře i jiné soubory anotací, například ‚processed_transcript‘.
- upravte prohledávanou oblast a možná upravte kód tak, aby vyhledával motivy know TF a miRNA spíše než de-novo motivy. Poznámka: Modiyfing krok hledání motivu je netriviální.
správce balíčků
Obecné
distribuce je postavena pomocí setuptools a formátu kola
- nastavení.py obsahuje všechny informace potřebné k vytvoření distribucezvyšte číslo verze před provedením distribuce
- Zaznamenejte změny související s uživatelem v changelogu.rst
sestavení distribuce
python3 setup.py sdist bdist_wheel
nahrávání na PyPI
twine upload-r pypi dist/cmonkey2- *