the organization of the genome in the nuclear space is nonrandom and affects genome functions, including transcription, replication, and repair. Regiões genômicas específicas, dos mesmos ou diferentes cromossomos, frequentemente associadas fisicamente uns com os outros e com estruturas nucleares, dando origem a um núcleo intrincadamente compartimentalizado. Exemplos de interações do genoma são a associação de um potenciador com um promotor ou o agrupamento de genes tais como genes rDNA no nucleolo. As interações genômicas têm sido tradicionalmente estudadas usando hibridização por fluorescência in situ (FISH), que permite visualizar a relação espacial entre genes distintos ou regiões do genoma. Limitações deste método são que apenas interações conhecidas podem ser interrogadas, apenas muito poucos loci podem ser sondados em uma experiência, e a resolução é limitada à óptica do microscópio.
a família de técnicas de captura de conformação cromossómica é um conjunto de abordagens bioquímicas para determinar a interacção física das regiões genómicas. C-tecnologia abordagens invariavelmente, envolvem-se em cinco etapas: (1) o formaldeído fixação uni-las cromatina em sites de interação física, (2) clivagem da cromatina por enzima de restrição ou sonicação, (3) ligadura em diluir as condições que favorecem a ligadura entre o DNA acaba capturado no mesmo complexo de mais de litigação de colisões aleatórias, (4) detecção de ligadura cruzamentos usando a variável de biologia molecular etapas dependendo da variante dos métodos, e (5) análise computacional para determinar a interação frequências capturado na ligadura do reticulado da cromatina.
C-technologies (3C, 4C, 5C, Hi-C) diferem em sua maneira de detecção e escopo das interações que podem sondar. O método 3C testa a interação entre dois locais conhecidos no genoma, 4C permite sondar interactores desconhecidos de uma sequência de isca conhecida, 5C identifica todas as regiões de interação dentro de um determinado domínio do genoma, e sondas Hi-C todas as interações ocorrendo em uma forma imparcial genoma. Variantes adicionais (ChIA-PET, ChIP-Loop) incorporam um passo de precipitação de proteínas, permitindo a identificação de interações do genoma que envolvem uma proteína específica de interesse. A escolha do método depende fortemente da natureza específica e do âmbito da questão biológica, mas também da disponibilidade de recursos, incluindo a quantidade de material de base e a capacidade de sequenciação. Muitos derivados das técnicas-C padrão foram desenvolvidos, muitas vezes inspirados pela questão biológica específica abordada ou com o objetivo de melhorar a especificidade ou reduzir o fundo.As tecnologias C são métodos baseados na população. Produzem probabilidades de contacto relativas em vez de frequências de contacto absolutas. A natureza baseada na população é devido ao fato de que cada locus genômico dá uma junção de ligação par-sábio em uma célula. Para permitir uma elevada cobertura e avaliação quantitativa dos perfis de contacto, devem ser incluídos e combinados em cada experiência milhares a milhões de equivalentes genómicos (células) contendo múltiplas junções de ligação. Correlações entre C contatos e DNA FISH indicaram que uma associação de intercâmbio que ocorre em 3% -5% das células de uma população será tipicamente detectada como positiva na maioria dos métodos C. Associações mais frequentes geralmente resultam em sinais mais fortes; no entanto, a força do sinal também pode refletir a afinidade das interações físicas e não a sua frequência.
um passo crítico na análise de dados é determinar se uma interação, detectada como uma junção de ligação, é específica. A frequência de contato diminui exponencialmente e está inversamente relacionada com a distância genômica linear até alguns Mb de distância do ponto de referência. Portanto, espera-se que a frequência de um contato específico na vizinhança de um locus seja maior do que o fundo de colisões aleatórias. Um bom indicador de especificidade para além da Gama Mb é a detecção de uma dada interação como aglomerados de sinais de fragmentos de restrição adjacentes.
a resolução dos métodos C é determinada pela natureza da(s) enzima (s) de restrição utilizada (s) e, no caso de métodos que utilizam sequenciação para detecção, também pelo número de leituras sequenciadas. A frequência das sequências de reconhecimento de uma endonuclease de quatro pares de bases (bp) é, em princípio, dezesseis vezes superior à frequência da sequência de reconhecimento de um separador de seis bp. Espera-se que o uso de um cortador de quatro bp aumente a resolução de contatos na gama Mb, onde múltiplos eventos de ligação são capturados para contatos específicos e colisões de fundo. Para além desta gama, no entanto, onde os aglomerados de fragmentos de restrição definem regiões de contato na faixa de dezenas a centenas de kb, espera-se que a vantagem de usar um cortador de quatro bp seja diminuída. Apesar de muitos ensaios em todo o genoma terem usado microarrays dedicados, a sequenciação de hi-throughput está se tornando o método de escolha para a detecção global de junções de ligação. A profundidade de sequenciamento é uma barreira técnica para resolução em algumas abordagens como Hi-C e ChIA-PET. As tecnologias baseadas na PCR superam esta limitação ampliando um subconjunto de contatos, com o tradeoff de cobertura reduzida. A natureza emparelhada dos produtos ligantes impõe um poder de duas relações entre o aumento na resolução e o aumento na profundidade de sequenciamento necessária. A cobertura genômica por profundidade de sequenciamento depende também do tamanho do genoma inspecionado. Por exemplo, o poder sequenciador similar fornece dezenas de kb de resolução de contato na levedura, mas apenas Mb resolução no genoma humano.