- Puerto cMonkey2-Python del algoritmo de biclustering de cMonkey
- Descripción
- Documentación
- Contacto
- Instalación
- Ejecutando cmonkey2
- Usando directamente desde el repositorio de código
- Usando una imagen de Docker
- Requisitos del sistema
- Ejecutar las pruebas unitarias
- Ejecutar cmonkey2
- Ejecución de prueba con Halobacterium Salinarum
- Iniciar la aplicación de monitoreo basada en python
- Otra forma de ejecutar Halobacterium es especificar la base de datos RSAT
- Ejecutar cMonkey en Humanos
- Más detalles para ejecutar cMonkey en datos humanos
- Mantenedores de paquetes
- General
- Distribución de compilación
- Carga en PyPI
Puerto cMonkey2-Python del algoritmo de biclustering de cMonkey
Descripción
Esta es la implementación en Python del algoritmo cMonkey basado en la implementación original de R de David J. Reiss, Instituto de Biología de Sistemas.
Documentación
Un conjunto completo de documentación para la instalación y ejecución de cMonkey está en las Páginas de Github del proyecto.
También hay grupos de discusión de desarrolladores y usuarios.
Contacto
Informe de todos los errores u otros problemas utilizando el gestor de problemas. Por favor, dirija todas y cada una de las preguntas a los grupos de discusión de desarrolladores o usuarios.
Instalación
La forma recomendada es instalar cmonkey2 a través de pip
pip install cmonkey2
Esto instalará las herramientas cmonkey2 y cm2view en su entorno python. Tenga en cuenta que tendrá que instalar MEME manualmente desde http://meme-suite.org/
Ejecutando cmonkey2
La forma más sencilla de ejecutar la herramienta (si todos los datos están disponibles en RSAT y STRING):
$ cmonkey2 --organism <organism-code> <tab separated file of gene expressions>
Para mostrar las opciones disponibles:
bin/cmonkey2.sh --help
Para ejecutar el organismo de ejemplo:
bin/cmonkey2.sh --organism hal --rsat_base_url http://networks.systemsbiology.net/rsat example_data/hal/halo_ratios5.tsv
Usando directamente desde el repositorio de código
A continuación se muestran las instrucciones para usar cmonkey2 directamente en el repositorio de código
Usando una imagen de Docker
PreCyte hizo que una imagen de Docker basada en cmonkey2 estuviera disponible en su cuenta de github
https://github.com/PreCyte/cMonkey2-docker/
Requisitos del sistema
cMonkey2 ha sido probado y se ejecuta en todas las versiones recientes probadas de Linux (incluidas las basadas en Debian y RPM ) y las versiones recientes de Mac OS X.:
- Desarrollado y probado con Python 2.7.x y Python 3.x
- scipy >= 0.9.0
- numpy >= 1.6.0
- biopython >= 1.63
- BeautifulSoup >= 4
- R >= 2.14.1
- rpy2 >= 2.2.1
- MEME 4.3.0 o >= 4.8.1 (4.12.0 aún no lo admite, trabaja actualmente en)
- csh (para la ejecución de MEME)
- pandas
- sqlalchemy y sqlalchemy-utils
- svgwrite
para los humanos, el programa de instalación, Weeder 1.4.2 se necesita
para la ejecución de la unidad de pruebas (opcional):
- python-xmlrunner
para ejecutar la aplicación web de visualización y monitorización interactiva (opcional):
- CherryPy 3
- Jinja2
- rutas python
Ejecutar las pruebas unitarias
bin/run_tests.sh
Ejecutar cmonkey2
En general, debería poder ejecutar cmonkey2 en relaciones de expresión génica microbiana con
bin/cmonkey2.sh --organism <organism-code> <tab separated file of gene expressions>
El archivo puede estar en su sistema de archivos o en una URL web.
Después de iniciar el programa, se escribirá un archivo de registro en cmonkey.registro. Puede ver todas las opciones disponibles con
bin/cmonkey2.sh --help
Ejecución de prueba con Halobacterium Salinarum
Hay un script de inicio para que cMonkey ejecute el sistema integrado actual
bin/cmonkey2.sh --organism hal example_data/hal/halo_ratios5.tsv
Iniciar la aplicación de monitoreo basada en python
bin/cm2view.sh ]
Otra forma de ejecutar Halobacterium es especificar la base de datos RSAT
bin/cmonkey2.sh --organism hal --rsat_organism Halobacterium_NRC_1_uid57769 --rsat_base_url http://pedagogix-tagc.univ-mrs.fr/rsat --rsat_features gene --nooperons --use_BSCM example_data/hal/halo_ratios5.tsv
Ejecutar cMonkey en Humanos
Para ejecutar cMonkey en datos humanos, ejecute el siguiente código con su propio archivo <ratios.tsv>
bin/cmonkey2.sh --organism hsa --string <stringFile> --rsat_organism Homo_sapiens_GRCh37 --rsat_URL http://rsat.sb-roscoff.fr/ --rsat_features protein_coding --nooperons <ratios.tsv>
Más detalles para ejecutar cMonkey en datos humanos
Ejecutar cMonkey en datos humanos es algo difícil porque ni la base de datos de cadenas ni la base de datos RSAT tienen datos humanos ingresados limpiamente. Estos son los pasos para una ejecución exitosa de python cMonkey en human
- Crear un archivo de interacción de genes. El archivo de datos de ejemplo mencionado anteriormente se generó a partir de Biogrid alrededor del 10/6/14.
- Encuentre un espejo RSAT que tenga .archivos crudos de chromose y archivos de características. En el ejemplo anterior, usamos Homo_sapiens_ensembl_74_GRCh37 de la base de datos principal de RSAT. Para anotarlas usamos ‘ protein_coding.pestaña’ y ‘protein_coding_names.tab’. En principio, otros archivos de anotación como ‘processed_transcript’ funcionarían igual de bien.
- Ajuste la región aguas arriba buscada, y quizás modifique el código para buscar motivos conocidos de TF y miRNA en lugar de motivos de novo. NOTA: Modificar el paso de búsqueda de motivos no es trivial.
Mantenedores de paquetes
General
La distribución se construye utilizando setuptools y formato de rueda
- configuración.py contiene toda la información necesaria para construir la distribuciónaumentar el número de versión antes de hacer una distribución
- registrar cambios relevantes para el usuario en el REGISTRO de CAMBIOS.rst
Distribución de compilación
python3 setup.py sdist bdist_wheel
Carga en PyPI
carga de cordel – r pypi dist / cmonkey2 – *