baliga-lab / cmonkey2

cMonkey2 Logo

cMonkey2 – Python port av cMonkey bicclustering algoritmen

Beskrivelse

dette er python-implementeringen av cmonkey-algoritmen basert på den opprinnelige r-implementeringen av david j. reiss, institute for systems biology.

Dokumentasjon

et komplett sett med dokumentasjon for installasjon og drift av cMonkey er på prosjektets Github-Sider.

det er også utvikler og bruker diskusjonsgrupper.

Kontakt

vennligst rapporter alle feil eller andre problemer ved hjelp av problemsporing. Vennligst direkte alle spørsmål til enten utvikler eller bruker diskusjonsgrupper.

Installasjon

den anbefalte måten er å installere cmonkey2 gjennom pip

pip install cmonkey2

dette vil installere verktøyene cmonkey2 og cm2view i python-miljøet. Vær oppmerksom på atdu må installere meme manuelt fra http://meme-suite.org/

Kjører cmonkey2

den enkleste måten å kjøre verktøyet på (hvis alle data er tilgjengelige I RSAT og STRENG):

$ cmonkey2 --organism <organism-code> <tab separated file of gene expressions>

for å vise tilgjengelige alternativer:

bin/cmonkey2.sh --help

å kjøre eksempelorganismen:

bin/cmonkey2.sh --organism hal --rsat_base_url http://networks.systemsbiology.net/rsat example_data/hal/halo_ratios5.tsv

Bruke direkte fra kildelageret

nedenfor er instruksjonene for å bruke cmonkey2 direkte i kildelageret

Bruke Et Docker-Bilde

PreCyte laget Et Docker-bilde basert på cmonkey2 tilgjengelig på deres github-konto

https://github.com/PreCyte/cMonkey2-docker/

Systemkrav

cMonkey2 har blitt testet og kjører på alle testede nyere versjoner Av Linux (inkludert debian-basert og RPM-basert ) og nyere versjoner Av Mac OS X. Ytterligere avhengigheter inkluderer:

  • Utviklet og testet Med Python 2.7.X Og Python 3.x
  • scipy >= 0.9.0
  • numpy >= 1.6.0
  • biopython >= 1.63
  • Vakkersuppe >= 4
  • R >= 2.14.1
  • rpy2 >= 2.2.1
  • MEME 4.3.0 eller >= 4.8.1 (4.12.0 ennå ikke støttet, for tiden jobbet på)
  • csh (for å kjøre MEME)
  • pandaer
  • sqlalchemy og sqlalchemy-utils
  • svgwrite

for DET MENNESKELIGE oppsettet, weeder 1.4.2 er nødvendig

for å kjøre enhetstestene (valgfritt):

  • python-xmlrunner

for å kjøre den interaktive overvåking og visualisering web-applikasjon (valgfritt):

  • CherryPy 3
  • Jinja2
  • python-ruter

Kjører Enhetstestene

bin/run_tests.sh

Kjører cmonkey2

generelt bør du kunne kjøre cmonkey2 på mikrobielle genekspresjonsforhold med

bin/cmonkey2.sh --organism <organism-code> <tab separated file of gene expressions>

Filen Kan Enten Være I Filsystemet Eller En Nettadresse.

etter at programmet ble startet, vil en loggfil bli skrevet i cmonkey.logge. Youcan se alle tilgjengelige alternativer med

bin/cmonkey2.sh --help

Testkjøring Med Halobacterium Salinarum

det er en oppstart script for cMonkey å kjøre gjeldende integratedsystem

bin/cmonkey2.sh --organism hal example_data/hal/halo_ratios5.tsv

Start python basert overvåking program

bin/cm2view.sh ]

En annen måte er å kjøre Halobacterium er angi RSAT database

bin/cmonkey2.sh --organism hal --rsat_organism Halobacterium_NRC_1_uid57769 --rsat_base_url http://pedagogix-tagc.univ-mrs.fr/rsat --rsat_features gene --nooperons --use_BSCM example_data/hal/halo_ratios5.tsv

kjører cmonkey på menneskelig

For Å Kjøre Cmonkey På Menneskelige Data, Kjør Følgende Kode Med Din Egen <ratios.tsv> fil

bin/cmonkey2.sh --organism hsa --string <stringFile> --rsat_organism Homo_sapiens_GRCh37 --rsat_URL http://rsat.sb-roscoff.fr/ --rsat_features protein_coding --nooperons <ratios.tsv>

flere detaljer for å kjøre cmonkey på menneskelige data

kjører cmonkey på menneskelige data er noe vanskelig fordi verken strengdatabasen eller RSAT-databasen har menneskelige data angitt rent. Her er trinnene for en vellykket python cMonkey-kjøring på human

  1. Lag en geninteraksjonsfil. Eksempeldatafilen nevnt ovenfor ble generert Fra Biogrid rundt 10/6/14.
  2. Finn ET RSAT speil som har .raw chromose-filer og funksjonsfiler. I eksemplet ovenfor bruker Vi Homo_sapiens_ensembl_74_GRCh37 fra HOVED RSAT-databasen. For å annotere disse bruker vi ‘ protein_coding.tab ‘ og ‘ protein_coding_names.tab’. I prinsippet vil andre annotasjonsfiler som’ processed_transcript ‘ fungere like bra.
  3. Juster oppstrømsregionen søkt, og kanskje endre koden for å søke etter kjente TF-og miRNA-motiver i stedet for de-novo-motiver. MERK: Modiyfinging motiv søketrinnet er ikke-trivielt.

Pakkevedlikeholdere

Generelt

distribusjonen er bygget ved hjelp av setuptools og hjulformat

  • oppsett.py inneholder all informasjon som trengs for å bygge distribusjonenøke versjonsnummeret før du gjør en distribusjon
  • record brukerrelevante endringer I CHANGELOG.rst

Bygg distribusjon

python3 setup.py sdist bdist_wheel

Opplasting Til PyPI

twine opplasting-r pypi dist / cmonkey2- *

Legg igjen en kommentar

Din e-postadresse vil ikke bli publisert.