baliga-lab / cmonkey2

cMonkey2 Logo

cMonkey2 – Python porta do cMonkey biclustering algoritmo

Descrição

Este é o Python implementação do cMonkey algoritmo baseado no original de R implementação por David J. Reiss, Instituto de Biologia de Sistemas.

Documentation

A complete set of documentation for installation and running of cMonkey is on the project’s Github Pages.

existem também grupos de discussão de desenvolvedores e usuários.

Contact

Please report all bugs or other issues using the issue tracker. Por favor, dirija qualquer e todas as perguntas para o desenvolvedor ou grupos de discussão do Usuário.

instalação

a forma recomendada é instalar o cmonkey2 através do pip

pip install cmonkey2

isto irá instalar as ferramentas cmonkey2 e cm2view no seu ambiente python. Por favor, note thatyou terá que instalar o MEME manualmente a partir de http://meme-suite.org/

Execução de cmonkey2

A maneira mais simples de executar a ferramenta (se todos os dados disponíveis no RSAT e CADEIA):

$ cmonkey2 --organism <organism-code> <tab separated file of gene expressions>

Para exibir as opções disponíveis:

bin/cmonkey2.sh --help

Para executar o exemplo organismo:

bin/cmonkey2.sh --organism hal --rsat_base_url http://networks.systemsbiology.net/rsat example_data/hal/halo_ratios5.tsv

Usando directamente a partir do repositório de código-fonte

Abaixo estão as instruções para usar cmonkey2 diretamente no repositório de código-fonte

Usando uma janela de Encaixe Imagem

PreCyte feita uma janela de Encaixe imagem com base na cmonkey2 disponível na sua conta do github

https://github.com/PreCyte/cMonkey2-docker/

Requisitos do sistema

cMonkey2 foi testado e funciona em todos testados versões recentes do Linux (incluindo baseada no debian e baseadas em RPM ) e versões recentes do Mac OS X. dependências Adicionais incluem:

  • Desenvolvido e testado com o Python 2.7.x e Python 3.x
  • scipy >= 0.9.0
  • numpy >= 1.6.0
  • biopython >= 1.63
  • BeautifulSoup >= 4
  • R >= 2.14.1
  • rpy2 >= 2.2.1
  • MEME 4.3.0 ou >= 4.8.1 (4.12.0 ainda não são suportados, atualmente trabalhado)
  • csh (para execução de MEME)
  • pandas
  • sqlalchemy e o sqlalchemy-utils
  • svgwrite

para o ser humano, instalação, Weeder 1.4.2 é necessário

para executar os testes de unidade (opcional):

  • python-xmlrunner

para a execução interativa de monitoramento e visualização do aplicativo web (opcional):

  • usar o cherrypy 3
  • Jinja2
  • python-rotas

Executar os Testes de Unidade

bin/run_tests.sh

Execução de cmonkey2

Em geral, você deve ser capaz de executar cmonkey2 microbiana geneexpression rácios

bin/cmonkey2.sh --organism <organism-code> <tab separated file of gene expressions>

O arquivo pode ser no seu sistema de arquivo ou uma URL da web.

depois que o programa foi iniciado, um arquivo de log será escrito em cmonkey.log. Pode ver todas as opções disponíveis com

bin/cmonkey2.sh --help

Execução de Teste com Halobacterium Salinarum

Há um script de inicialização para cMonkey para executar a atual integratedsystem

bin/cmonkey2.sh --organism hal example_data/hal/halo_ratios5.tsv

Iniciar o python monitoramento de aplicação

bin/cm2view.sh ]

uma Outra maneira de executar Halobacterium é especificar o RSAT de banco de dados

bin/cmonkey2.sh --organism hal --rsat_organism Halobacterium_NRC_1_uid57769 --rsat_base_url http://pedagogix-tagc.univ-mrs.fr/rsat --rsat_features gene --nooperons --use_BSCM example_data/hal/halo_ratios5.tsv

Execução de cMonkey Humanos

executar cMonkey humanos de dados, execute o seguinte código com o seu próprio <ratios.tsv> arquivo

bin/cmonkey2.sh --organism hsa --string <stringFile> --rsat_organism Homo_sapiens_GRCh37 --rsat_URL http://rsat.sb-roscoff.fr/ --rsat_features protein_coding --nooperons <ratios.tsv>

Mais detalhes para a execução de cMonkey humanos de dados

Execução de cMonkey Humanos de dados é um pouco difícil porque nem a base de dados string nem a base de dados RSAT tem dados humanos introduzidos de forma limpa. Aqui estão os passos para um sucesso python cMonkey run on human

  1. Make a gene interaction file. O arquivo de dados de exemplo mencionado acima foi gerado a partir de Biogrid por volta de 10/6/14.
  2. encontre um espelho RSAT que tenha .ficheiros cromose raw e ficheiros de funcionalidades. No exemplo acima, usamos o Homo_sapiens_ensembl_74_GRCh37 da base de dados principal do RSAT. Para anotar estes usamos ‘ protein_coding.tab’ e ‘ protein_coding_ Names.tab”. Em princípio, outros arquivos de anotação, como “processed_transcript”, funcionariam também.
  3. ajuste a região de upstream pesquisada, e talvez modifique o código para procurar por motivos conhecidos de TF e miRNA ao invés de motivos de novo. Nota: modificar o passo de pesquisa do motivo não é trivial.

mantenedores de pacotes

General

a distribuição é construída usando setuptools e formato de roda

  • configuração.o py contém toda a informação necessária para construir a distribuição aumenta o número da versão antes de fazer uma distribuição
  • registar alterações relevantes para o utilizador no CHANGELOG.primeiro

distribuição Construir

python3 setup.py sdist bdist_wheel

Upload para PyPI

cordéis upload-r pypi dist/cmonkey2-*

Deixe uma resposta

O seu endereço de email não será publicado.