baliga-lab / cmonkey2

cMonkey2 Logo

cMonkey2 – Python porta del cMonkey biclustering algoritmo

Descrizione

Questo è il Python attuazione del cMonkey algoritmo basato sull’originale R l’attuazione di David J. Reiss, Istituto per la Biologia dei Sistemi.

Documentazione

Un set completo di documentazione per l’installazione e l’esecuzione di cMonkey è nelle pagine Github del progetto.

Ci sono anche gruppi di discussione per sviluppatori e utenti.

Contatto

Si prega di segnalare tutti i bug o altri problemi utilizzando il issue tracker. Si prega di indirizzare tutte le domande ai gruppi di discussione degli sviluppatori o degli utenti.

Installazione

Il modo consigliato è installare cmonkey2 tramite pip

pip install cmonkey2

Questo installerà gli strumenti cmonkey2 e cm2view nel tuo ambiente python. Si prega di notare thatyou installare MEME manualmente da http://meme-suite.org/

Esecuzione cmonkey2

Il modo più semplice per eseguire lo strumento (se tutti i dati disponibili in RSAT e STRINGA):

$ cmonkey2 --organism <organism-code> <tab separated file of gene expressions>

Per visualizzare le opzioni disponibili:

bin/cmonkey2.sh --help

Per eseguire l’esempio di organismo:

bin/cmonkey2.sh --organism hal --rsat_base_url http://networks.systemsbiology.net/rsat example_data/hal/halo_ratios5.tsv

Utilizzando direttamente dalla repository di origine

di Seguito sono riportate le istruzioni per l’uso cmonkey2 direttamente nella repository di origine

Utilizzo di un Pannello Immagine

PreCyte fatto un Pannello immagine in base cmonkey2 disponibile sul loro account di github

https://github.com/PreCyte/cMonkey2-docker/

Requisiti di sistema

cMonkey2 è stato testato e funziona su tutte le testate versioni recenti di Linux (debian-based e basato su RPM ) e versioni più recenti di Mac OS X. dipendenze Aggiuntive includono:

  • Sviluppato e testato con Python 2.7.x e Python 3.x
  • scipy >= 0.9.0
  • numpy >= 1.6.0
  • biopython >= 1.63
  • Coherence >= 4
  • R >= 2.14.1
  • rpy2 >= 2.2.1
  • MEME 4.3.0 o >= 4.8.1 (4.12.0 non è ancora supportato, attualmente in lavorazione)
  • csh (per l’esecuzione di MEME)
  • panda
  • sqlalchemy e sqlalchemy-utils
  • svgwrite

per l’uomo di setup, Codice 1.4.2 è necessario

per l’esecuzione del test di unità (opzionale):

  • python-xmlrunner

per l’esecuzione del monitoraggio interattivo e la visualizzazione di applicazioni web (opzionale):

  • CherryPy 3
  • Jinja2
  • python-percorsi

Esecuzione di Unit Test

Esecuzione cmonkey2

In generale, si dovrebbe essere in grado di eseguire cmonkey2 su microbica geneexpression rapporti con

bin/cmonkey2.sh --organism <organism-code> <tab separated file of gene expressions>

Il file può essere nel vostro sistema di file o un URL web.

Dopo l’avvio del programma, verrà scritto un file di log in cmonkey.log. Nelle vicinanze è possibile vedere tutte le opzioni disponibili con

bin/cmonkey2.sh --help

Test Eseguito con Alobatterio Salinarum

C’è uno script di avvio per cMonkey per eseguire l’attuale integratedsystem

bin/cmonkey2.sh --organism hal example_data/hal/halo_ratios5.tsv

Avviare il python e il monitoraggio dell’applicazione

bin/cm2view.sh ]

un Altro modo è quello di eseguire Alobatterio è specificare il RSAT database

bin/cmonkey2.sh --organism hal --rsat_organism Halobacterium_NRC_1_uid57769 --rsat_base_url http://pedagogix-tagc.univ-mrs.fr/rsat --rsat_features gene --nooperons --use_BSCM example_data/hal/halo_ratios5.tsv

Esecuzione cMonkey Uomo

Per eseguire cMonkey su dati umani, eseguire il seguente codice con il proprio <ratios.tsv> file

bin/cmonkey2.sh --organism hsa --string <stringFile> --rsat_organism Homo_sapiens_GRCh37 --rsat_URL http://rsat.sb-roscoff.fr/ --rsat_features protein_coding --nooperons <ratios.tsv>

Ulteriori dettagli per l’esecuzione di cMonkey su dati umani

Esecuzione cMonkey su dati Umani è un po ‘ difficile perché né il database delle stringhe né il database RSAT hanno inserito dati umani in modo pulito. Ecco i passaggi per un successo python cMonkey eseguito su human

  1. Crea un file di interazione genica. Il file di dati di esempio sopra menzionato è stato generato da Biogrid intorno al 10/6/14.
  2. Trova uno specchio RSAT che ha .raw chromose file e file di funzionalità. Nell’esempio precedente, usiamo Homo_sapiens_ensembl_74_GRCh37 dal database RSAT principale. Per annotare questi usiamo ‘ protein_coding.tab ‘ e ‘ protein_coding_names.scheda’. In linea di principio, altri file di annotazione come ‘processed_transcript’ funzionerebbero altrettanto bene.
  3. Regola la regione a monte cercata e forse modifica il codice per cercare i motivi know TF e miRNA piuttosto che i motivi de-novo. NOTA: Modiyfing la fase di ricerca del motivo non è banale.

Manutentori dei pacchetti

Generale

La distribuzione è costruita utilizzando setuptools e wheel format

  • setup.py contiene tutte le informazioni necessarie per creare la distribuzioneaumentare il numero di versione prima di effettuare una distribuzione
  • registrare le modifiche rilevanti per l’utente nel CHANGELOG.rst

Crea distribuzione

python3 setup.py sdist bdist_wheel

Upload su PyPI

upload di spago-r pypi dist / cmonkey2- *

Lascia un commento

Il tuo indirizzo email non sarà pubblicato.