GitHub - baliga-lab/cmonkey2: Python port av cMonkey, en maskin-læring basert metode for clustering

cMonkey2 Logo

cMonkey2 – Python port av cMonkey bicclustering algoritmen

Beskrivelse

dette er python-implementeringen av cmonkey-algoritmen basert på den opprinnelige r-implementeringen av david j. reiss, institute for systems biology.

Dokumentasjon

et komplett sett med dokumentasjon for installasjon og drift av cMonkey er på prosjektets Github-Sider.

det er også utvikler og bruker diskusjonsgrupper.

Kontakt

vennligst rapporter alle feil eller andre problemer ved hjelp av problemsporing. Vennligst direkte alle spørsmål til enten utvikler eller bruker diskusjonsgrupper.

Installasjon

den anbefalte måten er å installere cmonkey2 gjennom pip

pip install cmonkey2

dette vil installere verktøyene cmonkey2 og cm2view i python-miljøet. Vær oppmerksom på atdu må installere meme manuelt fra http://meme-suite.org/

Kjører cmonkey2

den enkleste måten å kjøre verktøyet på (hvis alle data er tilgjengelige I RSAT og STRENG):

$ cmonkey2 --organism <organism-code> <tab separated file of gene expressions>

for å vise tilgjengelige alternativer:

bin/cmonkey2.sh --help

å kjøre eksempelorganismen:

bin/cmonkey2.sh --organism hal --rsat_base_url http://networks.systemsbiology.net/rsat example_data/hal/halo_ratios5.tsv

Bruke direkte fra kildelageret

nedenfor er instruksjonene for å bruke cmonkey2 direkte i kildelageret

Bruke Et Docker-Bilde

PreCyte laget Et Docker-bilde basert på cmonkey2 tilgjengelig på deres github-konto

https://github.com/PreCyte/cMonkey2-docker/

Systemkrav

cMonkey2 har blitt testet og kjører på alle testede nyere versjoner Av Linux (inkludert debian-basert og RPM-basert ) og nyere versjoner Av Mac OS X. Ytterligere avhengigheter inkluderer:

Utviklet og testet Med Python 2.7.X Og Python 3.x
scipy >= 0.9.0
numpy >= 1.6.0
biopython >= 1.63
Vakkersuppe >= 4
R >= 2.14.1
rpy2 >= 2.2.1
MEME 4.3.0 eller >= 4.8.1 (4.12.0 ennå ikke støttet, for tiden jobbet på)
csh (for å kjøre MEME)
pandaer
sqlalchemy og sqlalchemy-utils
svgwrite

for DET MENNESKELIGE oppsettet, weeder 1.4.2 er nødvendig

for å kjøre enhetstestene (valgfritt):

python-xmlrunner

for å kjøre den interaktive overvåking og visualisering web-applikasjon (valgfritt):

CherryPy 3
Jinja2
python-ruter

Kjører Enhetstestene

bin/run_tests.sh

Kjører cmonkey2

generelt bør du kunne kjøre cmonkey2 på mikrobielle genekspresjonsforhold med

bin/cmonkey2.sh --organism <organism-code> <tab separated file of gene expressions>

Filen Kan Enten Være I Filsystemet Eller En Nettadresse.

etter at programmet ble startet, vil en loggfil bli skrevet i cmonkey.logge. Youcan se alle tilgjengelige alternativer med

bin/cmonkey2.sh --help

Testkjøring Med Halobacterium Salinarum

det er en oppstart script for cMonkey å kjøre gjeldende integratedsystem

bin/cmonkey2.sh --organism hal example_data/hal/halo_ratios5.tsv

Start python basert overvåking program

bin/cm2view.sh ]

En annen måte er å kjøre Halobacterium er angi RSAT database

bin/cmonkey2.sh --organism hal --rsat_organism Halobacterium_NRC_1_uid57769 --rsat_base_url http://pedagogix-tagc.univ-mrs.fr/rsat --rsat_features gene --nooperons --use_BSCM example_data/hal/halo_ratios5.tsv

kjører cmonkey på menneskelig

For Å Kjøre Cmonkey På Menneskelige Data, Kjør Følgende Kode Med Din Egen <ratios.tsv> fil

bin/cmonkey2.sh --organism hsa --string <stringFile> --rsat_organism Homo_sapiens_GRCh37 --rsat_URL http://rsat.sb-roscoff.fr/ --rsat_features protein_coding --nooperons <ratios.tsv>

flere detaljer for å kjøre cmonkey på menneskelige data

kjører cmonkey på menneskelige data er noe vanskelig fordi verken strengdatabasen eller RSAT-databasen har menneskelige data angitt rent. Her er trinnene for en vellykket python cMonkey-kjøring på human

Lag en geninteraksjonsfil. Eksempeldatafilen nevnt ovenfor ble generert Fra Biogrid rundt 10/6/14.
Finn ET RSAT speil som har .raw chromose-filer og funksjonsfiler. I eksemplet ovenfor bruker Vi Homo_sapiens_ensembl_74_GRCh37 fra HOVED RSAT-databasen. For å annotere disse bruker vi ‘ protein_coding.tab ‘ og ‘ protein_coding_names.tab’. I prinsippet vil andre annotasjonsfiler som’ processed_transcript ‘ fungere like bra.
Juster oppstrømsregionen søkt, og kanskje endre koden for å søke etter kjente TF-og miRNA-motiver i stedet for de-novo-motiver. MERK: Modiyfinging motiv søketrinnet er ikke-trivielt.

Pakkevedlikeholdere

Generelt

distribusjonen er bygget ved hjelp av setuptools og hjulformat

oppsett.py inneholder all informasjon som trengs for å bygge distribusjonenøke versjonsnummeret før du gjør en distribusjon
record brukerrelevante endringer I CHANGELOG.rst

Bygg distribusjon

python3 setup.py sdist bdist_wheel

Opplasting Til PyPI

twine opplasting-r pypi dist / cmonkey2- *

baliga-lab / cmonkey2

cMonkey2 – Python port av cMonkey bicclustering algoritmen

Beskrivelse

Dokumentasjon

Kontakt

Installasjon

Kjører cmonkey2

Bruke direkte fra kildelageret

Bruke Et Docker-Bilde

Systemkrav

Kjører Enhetstestene

Kjører cmonkey2

Testkjøring Med Halobacterium Salinarum

Start python basert overvåking program

En annen måte er å kjøre Halobacterium er angi RSAT database

kjører cmonkey på menneskelig

flere detaljer for å kjøre cmonkey på menneskelige data

Pakkevedlikeholdere

Generelt

Bygg distribusjon

Opplasting Til PyPI

Legg igjen en kommentar Avbryt svar