GitHub - baliga-lab/cmonkey2: Python port av cMonkey, en maskininlärning baserad metod för klustring

cMonkey2 Logo

cMonkey2-Python port av cMonkey biclustering algoritm

beskrivning

detta är Python – implementeringen av cmonkey-algoritmen baserad på den ursprungliga r-implementeringen av David J. Reiss, Institute for systems biology.

dokumentation

en komplett uppsättning dokumentation för installation och körning av cMonkey finns på projektets Github-sidor.

det finns också utvecklare och användardiskussionsgrupper.

kontakta

rapportera alla fel eller andra problem med hjälp av issue tracker. Vänligen rikta alla frågor till antingen utvecklaren eller användardiskussionsgrupperna.

Installation

det rekommenderade sättet är att installera cmonkey2 genom pip

pip install cmonkey2

detta installerar verktygen cmonkey2 och cm2view i din python-miljö. Observera attdu måste installera MEME manuellt från http://meme-suite.org/

kör cmonkey2

det enklaste sättet att köra verktyget (om alla data finns i RSAT och sträng):

$ cmonkey2 --organism <organism-code> <tab separated file of gene expressions>

för att visa tillgängliga alternativ:

bin/cmonkey2.sh --help

att köra exemplet organism:

bin/cmonkey2.sh --organism hal --rsat_base_url http://networks.systemsbiology.net/rsat example_data/hal/halo_ratios5.tsv

använda direkt från källförvaret

nedan följer instruktionerna för att använda cmonkey2 direkt i källförvaret

använda en Docker-bild

PreCyte gjorde en Docker-bild baserad på cmonkey2 tillgänglig på deras github-konto

https://github.com/PreCyte/cMonkey2-docker/

Systemkrav

cMonkey2 har testats och körs på alla testade senaste versioner av Linux (inklusive debian-baserade och RPM-baserade ) och senaste versioner av Mac OS X. ytterligare beroenden inkluderar:

utvecklad och testad med Python 2.7.X och Python 3.X
scipy >= 0.9.0
numpy >= 1.6.0
biopython >= 1.63
BeautifulSoup >= 4
R >= 2.14.1
rpy2 >= 2.2.1
MEME 4.3.0 eller >= 4.8.1 (4.12.0 ännu inte stöds, för närvarande arbetat med)
csh (för att köra MEME)
pandor
sqlalchemy och sqlalchemy-utils
svgwrite

för den mänskliga inställningen, Weeder 1.4.2 behövs

för att köra enhetstesterna (tillval):

python-xmlrunner

för att köra den interaktiva övervakning och visualisering webbapplikation (tillval):

CherryPy 3
Jinja2
python-rutter

kör Enhetstesterna

bin/run_tests.sh

kör cmonkey2

i allmänhet bör du kunna köra cmonkey2 på mikrobiella geneexpressionsförhållanden med

bin/cmonkey2.sh --organism <organism-code> <tab separated file of gene expressions>

filen kan vara antingen i ditt filsystem eller en webbadress.

när programmet har startats kommer en loggfil att skrivas i cmonkey.logga. Du kan se alla tillgängliga alternativ med

bin/cmonkey2.sh --help

testkörning med Halobacterium Salinarum

det finns ett startskript för cMonkey för att köra det aktuella integratedsystem

bin/cmonkey2.sh --organism hal example_data/hal/halo_ratios5.tsv

starta python-baserade övervakningsprogrammet

bin/cm2view.sh ]

ett annat sätt är att köra Halobacterium anger RSAT-databasen

bin/cmonkey2.sh --organism hal --rsat_organism Halobacterium_NRC_1_uid57769 --rsat_base_url http://pedagogix-tagc.univ-mrs.fr/rsat --rsat_features gene --nooperons --use_BSCM example_data/hal/halo_ratios5.tsv

kör cmonkey på human

för att köra Cmonkey på Human Data, kör följande kod med din egen <ratios.tsv> fil

bin/cmonkey2.sh --organism hsa --string <stringFile> --rsat_organism Homo_sapiens_GRCh37 --rsat_URL http://rsat.sb-roscoff.fr/ --rsat_features protein_coding --nooperons <ratios.tsv>

mer information om att köra cmonkey på Human Data

kör cmonkey på human data är något svårt eftersom varken strängdatabasen eller RSAT-databasen har mänskliga data rent inmatade. Här är stegen för en framgångsrik python cMonkey-körning på människa

gör en geninteraktionsfil. Exempeldatafilen som nämns ovan genererades från Biogrid runt 10/6/14.
hitta en RSAT spegel som har .raw chromose-filer och funktionsfiler. I exemplet ovan använder vi Homo_sapiens_ensembl_74_GRCh37 från den huvudsakliga RSAT-databasen. För att kommentera dessa använder vi ’ protein_coding.fliken ’ och ’ protein_coding_names.fliken’. I princip skulle andra anteckningsfiler som ’processed_transcript’ fungera lika bra.
justera den sökta uppströmsregionen och kanske ändra koden för att söka efter kända TF-och miRNA-motiv snarare än de-novo-motiv. OBS!: Modiyfing av motivsökningssteget är inte trivialt.

paketansvariga

allmänt

distributionen är byggd med setuptools och hjulformat

inställning.py innehåller all information som behövs för att bygga distributionöka versionsnumret innan en distribution
spela in användarrelevanta ändringar i ändringsloggen.rst

Byggdistribution

python3 setup.py sdist bdist_wheel

uppladdning till PyPI

uppladdning av garn – r pypi dist / cmonkey2 – *

baliga-lab / cmonkey2

cMonkey2-Python port av cMonkey biclustering algoritm

beskrivning

dokumentation

kontakta

Installation

kör cmonkey2

använda direkt från källförvaret

använda en Docker-bild

Systemkrav

kör Enhetstesterna

kör cmonkey2

testkörning med Halobacterium Salinarum

starta python-baserade övervakningsprogrammet

ett annat sätt är att köra Halobacterium anger RSAT-databasen

kör cmonkey på human

mer information om att köra cmonkey på Human Data

paketansvariga

allmänt

Byggdistribution

uppladdning till PyPI

Lämna ett svar Avbryt svar