baliga-lab / cmonkey2

cMonkey2 Logo

cMonkey2 – Python-poort van de cMonkey biclustering algoritme

Beschrijving

Dit is de Python uitvoering van de cMonkey algoritme gebaseerd op de originele R uitvoering door David J. Reiss, Institute for Systems Biology.

documentatie

een complete set documentatie voor de installatie en het draaien van cMonkey staat op de Github pagina ‘ s van het project.

er zijn ook discussiegroepen voor ontwikkelaars en gebruikers.

Contact

meld alle bugs of andere problemen met behulp van de issue tracker. Stuur alle vragen naar de ontwikkelaar of gebruikers discussiegroepen.

installatie

de aanbevolen manier is om cmonkey2 te installeren via pip

pip install cmonkey2

dit zal de gereedschappen cmonkey2 en cm2view in uw python-omgeving installeren. Merk op dat u MEME handmatig moet installeren vanaf http://meme-suite.org/

met Cmonkey2

de eenvoudigste manier om het gereedschap uit te voeren (als alle gegevens beschikbaar zijn in RSAT en STRING):

$ cmonkey2 --organism <organism-code> <tab separated file of gene expressions>

beschikbare opties weergeven:

bin/cmonkey2.sh --help

om het voorbeeldorganisme uit te voeren:

bin/cmonkey2.sh --organism hal --rsat_base_url http://networks.systemsbiology.net/rsat example_data/hal/halo_ratios5.tsv

met Behulp van de direct van de bron repository

Hieronder staan de instructies voor het gebruiken van cmonkey2 rechtstreeks in de broncode repository

met Behulp van een Dokwerker Afbeelding

PreCyte gemaakt Dokwerker afbeelding gebaseerd op cmonkey2 beschikbaar op github account

https://github.com/PreCyte/cMonkey2-docker/

Systeem-eisen

cMonkey2 is getest en werkt op alle geteste recente versies van Linux (met inbegrip van debian gebaseerd en RPM-gebaseerde ) en recente versies van Mac OS X. Meer afhankelijkheden zijn:

  • Ontwikkeld en getest met Python 2.7.x en Python 3.x
  • scipy >= 0.9.0
  • numpy >= 1.6.0
  • biopython >= 1.63
  • BeautifulSoup >= 4
  • R >= 2.14.1
  • rpy2 >= 2.2.1
  • MEME 4.3.0 of >= 4.8.1 (4.12.0 nog niet ondersteund, momenteel aan gewerkt)
  • csh (voor het uitvoeren van MEME)
  • panda ‘ s
  • sqlalchemy en sqlalchemy-utils
  • svgwrite

voor de menselijke setup, Weeder 1.4.2 nodig

voor het uitvoeren van de unit-tests (optioneel):

  • python-xmlrunner

voor het uitvoeren van de interactieve monitoring en visualisatie web applicatie (optionele):

  • CherryPy 3
  • Jinja2
  • python-routes

het Uitvoeren van de Unit Tests

bin/run_tests.sh

Uitvoeren cmonkey2

In het algemeen, je moet in staat zijn om te draaien cmonkey2 op microbiële geneexpression ratio ‘ s met

bin/cmonkey2.sh --organism <organism-code> <tab separated file of gene expressions>

kan Het bestand in het bestandssysteem of een URL op het web.

nadat het programma is gestart, zal een logbestand worden geschreven in cmonkey.log. Youcan alle beschikbare opties met

bin/cmonkey2.sh --help

Test Uitvoeren met Halobacterium salinarum, net

Er is een startup script voor cMonkey voor het uitvoeren van de huidige integratedsystem

bin/cmonkey2.sh --organism hal example_data/hal/halo_ratios5.tsv

Start de python gebaseerde controle op de toepassing

bin/cm2view.sh ]

een Andere manier is om te draaien Halobacterium is het specificeren van de RSAT-database

bin/cmonkey2.sh --organism hal --rsat_organism Halobacterium_NRC_1_uid57769 --rsat_base_url http://pedagogix-tagc.univ-mrs.fr/rsat --rsat_features gene --nooperons --use_BSCM example_data/hal/halo_ratios5.tsv

Uitvoeren cMonkey op de Menselijke

uitvoeren cMonkey op gegevens bij de mens, voer de volgende code met uw eigen <ratios.tsv> bestand

bin/cmonkey2.sh --organism hsa --string <stringFile> --rsat_organism Homo_sapiens_GRCh37 --rsat_URL http://rsat.sb-roscoff.fr/ --rsat_features protein_coding --nooperons <ratios.tsv>

Meer informatie voor het uitvoeren van cMonkey op gegevens over de mens

Uitvoeren cMonkey op gegevens bij de Mens is een beetje moeilijk omdat noch de string-database, noch de RSAT-database menselijke gegevens netjes heeft ingevoerd. Hier zijn de stappen voor een succesvolle python cmonkey run op human

  1. Maak een geninteractie bestand. Het voorbeeldgegevensbestand hierboven werd gegenereerd uit Biogrid rond 10/6/14.
  2. zoek een RSAT-spiegel die heeft .raw chromose-bestanden en feature-bestanden. In het bovenstaande voorbeeld gebruiken we Homo_sapiens_ensembl_74_GRCh37 uit de hoofddatabase van RSAT. Om deze te annoteren gebruiken we ‘ protein_coding.tab’ en ‘ protein_coding_names.tab”. In principe zouden andere annotatiebestanden zoals ‘processed_transcript’ net zo goed werken.
  3. Pas de upstream-regio aan waar is gezocht, en wijzig misschien de code om te zoeken naar bekende TF-en miRNA-motieven in plaats van de-novo-motieven. Opmerking: het wijzigen van de zoekstap met motief is niet-triviaal.

Pakketonderhouders

Algemeen

de distributie is opgebouwd met setuptools en wheel format

  • setup.py bevat alle informatie die nodig is om de distributie te bouwen verhoog het versienummer voordat een distributie
  • voor de gebruiker relevante wijzigingen in CHANGELOG registreert.rst

Build-distributie

python3 setup.py sdist bdist_wheel

uploaden naar PyPI

twine Upload-r pypi dist/cmonkey2 – *

Geef een antwoord

Het e-mailadres wordt niet gepubliceerd.