baliga-lab / cmonkey2

Logotipo de cMonkey2

Puerto cMonkey2-Python del algoritmo de biclustering de cMonkey

Descripción

Esta es la implementación en Python del algoritmo cMonkey basado en la implementación original de R de David J. Reiss, Instituto de Biología de Sistemas.

Documentación

Un conjunto completo de documentación para la instalación y ejecución de cMonkey está en las Páginas de Github del proyecto.

También hay grupos de discusión de desarrolladores y usuarios.

Contacto

Informe de todos los errores u otros problemas utilizando el gestor de problemas. Por favor, dirija todas y cada una de las preguntas a los grupos de discusión de desarrolladores o usuarios.

Instalación

La forma recomendada es instalar cmonkey2 a través de pip

pip install cmonkey2

Esto instalará las herramientas cmonkey2 y cm2view en su entorno python. Tenga en cuenta que tendrá que instalar MEME manualmente desde http://meme-suite.org/

Ejecutando cmonkey2

La forma más sencilla de ejecutar la herramienta (si todos los datos están disponibles en RSAT y STRING):

$ cmonkey2 --organism <organism-code> <tab separated file of gene expressions>

Para mostrar las opciones disponibles:

bin/cmonkey2.sh --help

Para ejecutar el organismo de ejemplo:

bin/cmonkey2.sh --organism hal --rsat_base_url http://networks.systemsbiology.net/rsat example_data/hal/halo_ratios5.tsv

Usando directamente desde el repositorio de código

A continuación se muestran las instrucciones para usar cmonkey2 directamente en el repositorio de código

Usando una imagen de Docker

PreCyte hizo que una imagen de Docker basada en cmonkey2 estuviera disponible en su cuenta de github

https://github.com/PreCyte/cMonkey2-docker/

Requisitos del sistema

cMonkey2 ha sido probado y se ejecuta en todas las versiones recientes probadas de Linux (incluidas las basadas en Debian y RPM ) y las versiones recientes de Mac OS X.:

  • Desarrollado y probado con Python 2.7.x y Python 3.x
  • scipy >= 0.9.0
  • numpy >= 1.6.0
  • biopython >= 1.63
  • BeautifulSoup >= 4
  • R >= 2.14.1
  • rpy2 >= 2.2.1
  • MEME 4.3.0 o >= 4.8.1 (4.12.0 aún no lo admite, trabaja actualmente en)
  • csh (para la ejecución de MEME)
  • pandas
  • sqlalchemy y sqlalchemy-utils
  • svgwrite

para los humanos, el programa de instalación, Weeder 1.4.2 se necesita

para la ejecución de la unidad de pruebas (opcional):

  • python-xmlrunner

para ejecutar la aplicación web de visualización y monitorización interactiva (opcional):

  • CherryPy 3
  • Jinja2
  • rutas python

Ejecutar las pruebas unitarias

bin/run_tests.sh

Ejecutar cmonkey2

En general, debería poder ejecutar cmonkey2 en relaciones de expresión génica microbiana con

bin/cmonkey2.sh --organism <organism-code> <tab separated file of gene expressions>

El archivo puede estar en su sistema de archivos o en una URL web.

Después de iniciar el programa, se escribirá un archivo de registro en cmonkey.registro. Puede ver todas las opciones disponibles con

bin/cmonkey2.sh --help

Ejecución de prueba con Halobacterium Salinarum

Hay un script de inicio para que cMonkey ejecute el sistema integrado actual

bin/cmonkey2.sh --organism hal example_data/hal/halo_ratios5.tsv

Iniciar la aplicación de monitoreo basada en python

bin/cm2view.sh ]

Otra forma de ejecutar Halobacterium es especificar la base de datos RSAT

bin/cmonkey2.sh --organism hal --rsat_organism Halobacterium_NRC_1_uid57769 --rsat_base_url http://pedagogix-tagc.univ-mrs.fr/rsat --rsat_features gene --nooperons --use_BSCM example_data/hal/halo_ratios5.tsv

Ejecutar cMonkey en Humanos

Para ejecutar cMonkey en datos humanos, ejecute el siguiente código con su propio archivo <ratios.tsv>

bin/cmonkey2.sh --organism hsa --string <stringFile> --rsat_organism Homo_sapiens_GRCh37 --rsat_URL http://rsat.sb-roscoff.fr/ --rsat_features protein_coding --nooperons <ratios.tsv>

Más detalles para ejecutar cMonkey en datos humanos

Ejecutar cMonkey en datos humanos es algo difícil porque ni la base de datos de cadenas ni la base de datos RSAT tienen datos humanos ingresados limpiamente. Estos son los pasos para una ejecución exitosa de python cMonkey en human

  1. Crear un archivo de interacción de genes. El archivo de datos de ejemplo mencionado anteriormente se generó a partir de Biogrid alrededor del 10/6/14.
  2. Encuentre un espejo RSAT que tenga .archivos crudos de chromose y archivos de características. En el ejemplo anterior, usamos Homo_sapiens_ensembl_74_GRCh37 de la base de datos principal de RSAT. Para anotarlas usamos ‘ protein_coding.pestaña’ y ‘protein_coding_names.tab’. En principio, otros archivos de anotación como ‘processed_transcript’ funcionarían igual de bien.
  3. Ajuste la región aguas arriba buscada, y quizás modifique el código para buscar motivos conocidos de TF y miRNA en lugar de motivos de novo. NOTA: Modificar el paso de búsqueda de motivos no es trivial.

Mantenedores de paquetes

General

La distribución se construye utilizando setuptools y formato de rueda

  • configuración.py contiene toda la información necesaria para construir la distribuciónaumentar el número de versión antes de hacer una distribución
  • registrar cambios relevantes para el usuario en el REGISTRO de CAMBIOS.rst

Distribución de compilación

python3 setup.py sdist bdist_wheel

Carga en PyPI

carga de cordel – r pypi dist / cmonkey2 – *

Deja una respuesta

Tu dirección de correo electrónico no será publicada.