- cMonkey2 – Python-poort van de cMonkey biclustering algoritme
- Beschrijving
- documentatie
- Contact
- installatie
- met Cmonkey2
- met Behulp van de direct van de bron repository
- met Behulp van een Dokwerker Afbeelding
- Systeem-eisen
- het Uitvoeren van de Unit Tests
- Uitvoeren cmonkey2
- Test Uitvoeren met Halobacterium salinarum, net
- Start de python gebaseerde controle op de toepassing
- een Andere manier is om te draaien Halobacterium is het specificeren van de RSAT-database
- Uitvoeren cMonkey op de Menselijke
- Meer informatie voor het uitvoeren van cMonkey op gegevens over de mens
- Pakketonderhouders
- Algemeen
- Build-distributie
- uploaden naar PyPI
cMonkey2 – Python-poort van de cMonkey biclustering algoritme
Beschrijving
Dit is de Python uitvoering van de cMonkey algoritme gebaseerd op de originele R uitvoering door David J. Reiss, Institute for Systems Biology.
documentatie
een complete set documentatie voor de installatie en het draaien van cMonkey staat op de Github pagina ‘ s van het project.
er zijn ook discussiegroepen voor ontwikkelaars en gebruikers.
Contact
meld alle bugs of andere problemen met behulp van de issue tracker. Stuur alle vragen naar de ontwikkelaar of gebruikers discussiegroepen.
installatie
de aanbevolen manier is om cmonkey2 te installeren via pip
pip install cmonkey2
dit zal de gereedschappen cmonkey2 en cm2view in uw python-omgeving installeren. Merk op dat u MEME handmatig moet installeren vanaf http://meme-suite.org/
met Cmonkey2
de eenvoudigste manier om het gereedschap uit te voeren (als alle gegevens beschikbaar zijn in RSAT en STRING):
$ cmonkey2 --organism <organism-code> <tab separated file of gene expressions>
beschikbare opties weergeven:
bin/cmonkey2.sh --help
om het voorbeeldorganisme uit te voeren:
bin/cmonkey2.sh --organism hal --rsat_base_url http://networks.systemsbiology.net/rsat example_data/hal/halo_ratios5.tsv
met Behulp van de direct van de bron repository
Hieronder staan de instructies voor het gebruiken van cmonkey2 rechtstreeks in de broncode repository
met Behulp van een Dokwerker Afbeelding
PreCyte gemaakt Dokwerker afbeelding gebaseerd op cmonkey2 beschikbaar op github account
https://github.com/PreCyte/cMonkey2-docker/
Systeem-eisen
cMonkey2 is getest en werkt op alle geteste recente versies van Linux (met inbegrip van debian gebaseerd en RPM-gebaseerde ) en recente versies van Mac OS X. Meer afhankelijkheden zijn:
- Ontwikkeld en getest met Python 2.7.x en Python 3.x
- scipy >= 0.9.0
- numpy >= 1.6.0
- biopython >= 1.63
- BeautifulSoup >= 4
- R >= 2.14.1
- rpy2 >= 2.2.1
- MEME 4.3.0 of >= 4.8.1 (4.12.0 nog niet ondersteund, momenteel aan gewerkt)
- csh (voor het uitvoeren van MEME)
- panda ‘ s
- sqlalchemy en sqlalchemy-utils
- svgwrite
voor de menselijke setup, Weeder 1.4.2 nodig
voor het uitvoeren van de unit-tests (optioneel):
- python-xmlrunner
voor het uitvoeren van de interactieve monitoring en visualisatie web applicatie (optionele):
- CherryPy 3
- Jinja2
- python-routes
het Uitvoeren van de Unit Tests
bin/run_tests.sh
Uitvoeren cmonkey2
In het algemeen, je moet in staat zijn om te draaien cmonkey2 op microbiële geneexpression ratio ‘ s met
bin/cmonkey2.sh --organism <organism-code> <tab separated file of gene expressions>
kan Het bestand in het bestandssysteem of een URL op het web.
nadat het programma is gestart, zal een logbestand worden geschreven in cmonkey.log. Youcan alle beschikbare opties met
bin/cmonkey2.sh --help
Test Uitvoeren met Halobacterium salinarum, net
Er is een startup script voor cMonkey voor het uitvoeren van de huidige integratedsystem
bin/cmonkey2.sh --organism hal example_data/hal/halo_ratios5.tsv
Start de python gebaseerde controle op de toepassing
bin/cm2view.sh ]
een Andere manier is om te draaien Halobacterium is het specificeren van de RSAT-database
bin/cmonkey2.sh --organism hal --rsat_organism Halobacterium_NRC_1_uid57769 --rsat_base_url http://pedagogix-tagc.univ-mrs.fr/rsat --rsat_features gene --nooperons --use_BSCM example_data/hal/halo_ratios5.tsv
Uitvoeren cMonkey op de Menselijke
uitvoeren cMonkey op gegevens bij de mens, voer de volgende code met uw eigen <ratios.tsv>
bestand
bin/cmonkey2.sh --organism hsa --string <stringFile> --rsat_organism Homo_sapiens_GRCh37 --rsat_URL http://rsat.sb-roscoff.fr/ --rsat_features protein_coding --nooperons <ratios.tsv>
Meer informatie voor het uitvoeren van cMonkey op gegevens over de mens
Uitvoeren cMonkey op gegevens bij de Mens is een beetje moeilijk omdat noch de string-database, noch de RSAT-database menselijke gegevens netjes heeft ingevoerd. Hier zijn de stappen voor een succesvolle python cmonkey run op human
- Maak een geninteractie bestand. Het voorbeeldgegevensbestand hierboven werd gegenereerd uit Biogrid rond 10/6/14.
- zoek een RSAT-spiegel die heeft .raw chromose-bestanden en feature-bestanden. In het bovenstaande voorbeeld gebruiken we Homo_sapiens_ensembl_74_GRCh37 uit de hoofddatabase van RSAT. Om deze te annoteren gebruiken we ‘ protein_coding.tab’ en ‘ protein_coding_names.tab”. In principe zouden andere annotatiebestanden zoals ‘processed_transcript’ net zo goed werken.
- Pas de upstream-regio aan waar is gezocht, en wijzig misschien de code om te zoeken naar bekende TF-en miRNA-motieven in plaats van de-novo-motieven. Opmerking: het wijzigen van de zoekstap met motief is niet-triviaal.
Pakketonderhouders
Algemeen
de distributie is opgebouwd met setuptools en wheel format
- setup.py bevat alle informatie die nodig is om de distributie te bouwen verhoog het versienummer voordat een distributie
- voor de gebruiker relevante wijzigingen in CHANGELOG registreert.rst
Build-distributie
python3 setup.py sdist bdist_wheel
uploaden naar PyPI
twine Upload-r pypi dist/cmonkey2 – *