baliga-lab / cmonkey2

Logo-ul cMonkey2

portul Cmonkey2 – Python al algoritmului cMonkey biclustering

descriere

aceasta este implementarea Python a algoritmului cmonkey bazat pe implementarea originală r de David J. Reiss, Institutul de biologie a sistemelor.

documentație

un set complet de documentație pentru instalarea și rularea cMonkey este pe paginile GitHub proiectului.

există, de asemenea, grupuri de discuții pentru dezvoltatori și utilizatori.

Contact

vă rugăm să raportați toate bug-uri sau alte probleme folosind tracker problemă. Vă rugăm să directe orice și toate întrebările fie dezvoltator sau grupuri de discuții de utilizator.

instalare

modul recomandat este să instalați cmonkey2 prin pip

pip install cmonkey2

aceasta va instala instrumentele cmonkey2 și cm2view în mediul python. Vă rugăm să rețineți căva trebui să instalați manual MEME de la http://meme-suite.org/

rularea cmonkey2

cel mai simplu mod de a rula instrumentul (dacă toate datele disponibile în RSAT și șir):

$ cmonkey2 --organism <organism-code> <tab separated file of gene expressions>

pentru a afișa opțiunile disponibile:

bin/cmonkey2.sh --help

pentru a rula organismul exemplu:

bin/cmonkey2.sh --organism hal --rsat_base_url http://networks.systemsbiology.net/rsat example_data/hal/halo_ratios5.tsv

utilizarea directă din depozitul sursă

mai jos sunt instrucțiunile de utilizare a cmonkey2 direct în depozitul sursă

utilizarea unei imagini Docker

PreCyte a făcut disponibilă o imagine Docker bazată pe cmonkey2 în contul lor github

https://github.com/PreCyte/cMonkey2-docker/

cerințe de sistem

cMonkey2 a fost testat și rulează pe toate versiunile recente testate de Linux (inclusiv debian-based și RPM-based) și versiunile recente de Mac OS X. dependențe suplimentare includ:

  • dezvoltat și testat cu Python 2.7.X și Python 3.x
  • scipy >= 0.9.0
  • numpy >= 1.6.0
  • biopiton >= 1.63
  • BeautifulSoup >= 4
  • R >= 2.14.1
  • rpy2 >= 2.2.1
  • MEME 4.3.0 sau >= 4.8.1 (4.12.0 nu sunt încă acceptate, în prezent a lucrat la)
  • csh (pentru rularea MEME)
  • Panda
  • sqlalchemy și SQLAlchemy-utils
  • svgwrite

pentru configurarea umană, Weeder 1.4.2 Este necesară

pentru rularea testelor unitare (opțional):

  • python-xmlrunner

pentru rularea aplicației web interactive de monitorizare și vizualizare (opțional):

  • CherryPy 3
  • Jinja2
  • python-rute

rularea testelor unitare

bin/run_tests.sh

rularea cmonkey2

în general, ar trebui să puteți rula cmonkey2 pe rapoarte de Expresie genă microbiană cu

bin/cmonkey2.sh --organism <organism-code> <tab separated file of gene expressions>

fișierul poate fi fie în sistemul dvs. de Fișiere, fie într-o adresă URL Web.

după ce programul a fost pornit, un fișier jurnal va fi scris în cmonkey.jurnal. Youcan vedea toate opțiunile disponibile cu

bin/cmonkey2.sh --help

test rula cu Halobacterium Salinarum

există un script de pornire pentru cMonkey pentru a rula integratedsystem curent

bin/cmonkey2.sh --organism hal example_data/hal/halo_ratios5.tsv

porniți aplicația de monitorizare python bazat

bin/cm2view.sh ]

un alt mod este de a rula Halobacterium este specifica baza de date RSAT

bin/cmonkey2.sh --organism hal --rsat_organism Halobacterium_NRC_1_uid57769 --rsat_base_url http://pedagogix-tagc.univ-mrs.fr/rsat --rsat_features gene --nooperons --use_BSCM example_data/hal/halo_ratios5.tsv

rularea cmonkey on human

pentru a rula Cmonkey on Human Data, executați următorul cod cu propriul fișier <ratios.tsv>

bin/cmonkey2.sh --organism hsa --string <stringFile> --rsat_organism Homo_sapiens_GRCh37 --rsat_URL http://rsat.sb-roscoff.fr/ --rsat_features protein_coding --nooperons <ratios.tsv>

mai multe detalii pentru rularea cmonkey on human data

rularea cmonkey on human data este oarecum dificilă deoarece nici baza de date string, nici baza de date RSAT nu au introdus date umane curate. Aici sunt pașii pentru un succes Python cMonkey rula pe uman

  1. face un fișier de interacțiune genică. Fișierul de date exemplu menționat mai sus a fost generat de Biogrid în jurul valorii de 10/6/14.
  2. găsiți o oglindă RSAT care are .fișiere chromose raw și fișiere de caracteristici. În exemplul de mai sus, folosim Homo_sapiens_ensembl_74_GRCh37 din Baza de date principală RSAT. Pentru a adnota aceste folosim ‘ protein_coding.tab’ și ‘ protein_coding_names.tab’. În principal, alte fișiere de adnotare, cum ar fi’ processed_transcript ‘ ar funcționa la fel de bine.
  3. ajustați regiunea din amonte căutată și, probabil, modificați codul pentru a căuta motive cunoscute TF și miRNA, mai degrabă decât motive de-novo. Notă: Modiyfing pasul de căutare motiv este non-banal.

întreținători de pachete

General

distribuția este construită folosind setuptools și formatul roții

  • configurare.py conține toate informațiile necesare pentru a construi distributionincrease Numărul versiunii înainte de a face o distribuție
  • înregistrare modificări relevante pentru utilizator în CHANGELOG.prima

distribuție de construcție

python3 setup.py sdist bdist_wheel

încărcarea la PyPI

încărcare sfoară-r PyPI dist / cmonkey2 – *

Lasă un răspuns

Adresa ta de email nu va fi publicată.