baliga-lab / cmonkey2

cMonkey2 Logo

cMonkey2 – Python port af cmonkey biclustering algoritme

beskrivelse

dette er python-implementeringen af Cmonkey-algoritmen baseret på den oprindelige r-implementering af David J. Reiss, Institut for systembiologi.

dokumentation

et komplet sæt dokumentation til installation og drift af cMonkey findes på projektets Github-sider.

der er også udvikler-og brugerdiskussionsgrupper.

kontakt

rapporter venligst alle fejl eller andre problemer ved hjælp af issue tracker. Venligst rette alle spørgsmål til enten udvikleren eller bruger diskussionsgrupper.

Installation

den anbefalede måde er at installere cmonkey2 gennem pip

pip install cmonkey2

dette vil installere værktøjerne cmonkey2 og cm2visning i dit python-miljø. Bemærk detdu bliver nødt til at installere MEME manuelt fra http://meme-suite.org/

kører cmonkey2

den enkleste måde at køre værktøjet på (hvis alle data er tilgængelige i RSAT og streng):

$ cmonkey2 --organism <organism-code> <tab separated file of gene expressions>

for at vise tilgængelige indstillinger:

bin/cmonkey2.sh --help

at køre eksemplet organisme:

bin/cmonkey2.sh --organism hal --rsat_base_url http://networks.systemsbiology.net/rsat example_data/hal/halo_ratios5.tsv

brug direkte fra kildelageret

nedenfor er instruktionerne til brug af cmonkey2 direkte i kildelageret

brug af et Docker-billede

PreCyte lavede et Docker-billede baseret på cmonkey2 tilgængeligt på deres github-konto

https://github.com/PreCyte/cMonkey2-docker/

systemkrav

cMonkey2 er blevet testet og kører på alle testede nyere versioner (herunder debian-baserede og RPM-baserede) og nyere versioner af Mac OS. yderligere afhængigheder omfatter:

  • udviklet og testet med Python 2.7.Python og Python 3.
  • scipy >= 0.9.0
  • numpy >= 1.6.0
  • biopython >= 1.63
  • BeautifulSoup >= 4
  • R >= 2.14.1
  • rpy2 >= 2.2.1
  • MEME 4.3.0 eller >= 4.8.1 (4.12.0 endnu ikke understøttet, i øjeblikket arbejdet på)
  • csh (til at køre MEME)
  • pandas
  • kvlalkemi og kvlalkemi-utils
  • svgskriv

til 1.4.2 er nødvendig

for at køre enhedstestene (valgfrit):

  • python-mlrunner

til at køre den interaktive overvågning og visualisering):

  • CherryPy 3
  • Jinja2
  • python-ruter

kører Enhedstestene

kører cmonkey2

generelt skal du kunne køre cmonkey2 på mikrobielle genekspressionsforhold med

bin/cmonkey2.sh --organism <organism-code> <tab separated file of gene expressions>

filen kan enten være i dit filsystem eller en URL-adresse.

efter at programmet blev startet, skrives en logfil i cmonkey.log. Youcan se alle tilgængelige muligheder med

bin/cmonkey2.sh --help

testkørsel med Halobacterium Salinarum

der er et startup script til cMonkey til at køre det nuværende integratedsystem

bin/cmonkey2.sh --organism hal example_data/hal/halo_ratios5.tsv

Start python-baseret overvågningsprogram

bin/cm2view.sh ]

en anden måde er at køre Halobacterium er Angiv RSAT-databasen

bin/cmonkey2.sh --organism hal --rsat_organism Halobacterium_NRC_1_uid57769 --rsat_base_url http://pedagogix-tagc.univ-mrs.fr/rsat --rsat_features gene --nooperons --use_BSCM example_data/hal/halo_ratios5.tsv

running cmonkey on human

for at køre Cmonkey on Human Data skal du køre følgende kode med din egen <ratios.tsv> fil

bin/cmonkey2.sh --organism hsa --string <stringFile> --rsat_organism Homo_sapiens_GRCh37 --rsat_URL http://rsat.sb-roscoff.fr/ --rsat_features protein_coding --nooperons <ratios.tsv>

flere detaljer for at køre cmonkey on human data

running cmonkey on human data er noget svært fordi hverken strengdatabasen eller RSAT-databasen har indtastet menneskelige data rent. Her er trinene til en vellykket python cMonkey-kørsel på human

  1. lav en geninteraktionsfil. Ovennævnte eksempeldatafil blev genereret fra Biogrid omkring 10/6/14.
  2. Find et RSAT-spejl, der har .rå chromose filer og feature filer. I ovenstående eksempel bruger vi Homo_sapiens_ensembl_74_GRCh37 fra den vigtigste RSAT-database. For at kommentere disse bruger vi ‘ protein_coding.tab ‘og’ protein_coding_names.tab’. I princippet ville andre annotationsfiler som ‘processed_transcript’ fungere lige så godt.
  3. Juster opstrømsregionen søgt, og måske ændre koden for at søge efter kendte tf-og miRNA-motiver snarere end de-novo-motiver. Bemærk: ændring af motivsøgningstrinnet er ikke trivielt.

Pakkevedligeholdere

generelt

distributionen er bygget ved hjælp af setuptools og hjulformat

  • opsætning.py indeholder alle oplysninger, der er nødvendige for at opbygge distributionenøge versionsnummeret, før du foretager en distribution
  • Optag brugerrelevante ændringer i CHANGELOG.rst

Byg distribution

python3 setup.py sdist bdist_hjul

upload til PyPI

garn upload-r pypi dist/cmonkey2 – *

Skriv et svar

Din e-mailadresse vil ikke blive publiceret.