La organización del genoma en el espacio nuclear no es aleatoria y afecta las funciones del genoma, incluida la transcripción, la replicación y la reparación. Regiones genómicas específicas, de cromosomas iguales o diferentes, frecuentemente se asocian físicamente entre sí y con estructuras nucleares, dando lugar a un núcleo intrincadamente compartimentado. Ejemplos de interacciones genómicas son la asociación de un potenciador con un promotor o la agrupación de genes como los genes del ADNr en el nucléolo. Las interacciones genómicas se han estudiado tradicionalmente mediante hibridación fluorescente in situ (FISH), que permite la visualización de la relación espacial entre distintos genes o regiones genómicas. Las limitaciones de este método son que solo se pueden interrogar las interacciones conocidas, solo se pueden sondear muy pocos loci en un experimento y la resolución se limita a la óptica del microscopio.
La familia de técnicas de captura de conformación cromosómica es un conjunto de enfoques bioquímicos para determinar la interacción física de las regiones del genoma. Los enfoques de la tecnología C implican invariablemente cinco pasos: (1) fijación de formaldehído para reticular la cromatina en sitios de interacción física, (2) escisión de la cromatina por enzima de restricción o sonicación, (3) ligadura en condiciones diluidas que favorecen la ligadura entre extremos de ADN capturados en el mismo complejo sobre ligaduras de colisiones aleatorias, (4) detección de uniones de ligadura utilizando pasos variables de biología molecular dependiendo de la variante de los métodos, y (5) análisis computacional para determinar las frecuencias de interacción capturadas en la ligadura de la cromatina reticulada.
Las tecnologías C (3C, 4C, 5C, Hi-C) difieren en su forma de detección y alcance de las interacciones que pueden sondear. El método 3C prueba la interacción entre dos sitios conocidos en el genoma, el 4C permite sondear interactores desconocidos de una secuencia de cebo conocida, el 5C identifica todas las regiones de interacción dentro de un dominio del genoma dado, y el Hi-C sondea todas las interacciones que ocurren de manera imparcial en todo el genoma. Variantes adicionales (ChIA-PET, CHIP-Loop) incorporan un paso de precipitación de proteínas, lo que permite la identificación de interacciones del genoma que involucran una proteína específica de interés. La elección del método depende en gran medida de la naturaleza y el alcance específicos de la cuestión biológica, pero también de la disponibilidad de recursos, incluida la cantidad de material de partida y la capacidad de secuenciación. Se han desarrollado muchos derivados de las técnicas C estándar, a menudo inspirados en la pregunta biológica específica abordada o con el objetivo de mejorar la especificidad o reducir el fondo.
Las tecnologías C son métodos basados en poblaciones. Producen probabilidades de contacto relativas en lugar de frecuencias de contacto absolutas. La naturaleza basada en la población se debe al hecho de que cada locus genómico da una unión de ligadura por pares en una célula. Para permitir una alta cobertura y una evaluación cuantitativa de los perfiles de contacto, se deben incluir y combinar en cada experimento entre miles y millones de equivalentes genómicos (células) que contienen múltiples uniones de ligadura. Las correlaciones entre los contactos C y el ADN FISH han indicado que una asociación intercromosómica que ocurre en el 3-5% de las células de una población se detectará típicamente como positiva en la mayoría de los métodos C. Las asociaciones más frecuentes generalmente resultan en señales más fuertes; sin embargo, la intensidad de la señal también puede reflejar la afinidad de las interacciones físicas y no su frecuencia.
Un paso crítico en el análisis de datos es determinar si una interacción, detectada como unión de ligadura, es específica. La frecuencia de contacto disminuye exponencialmente y está inversamente relacionada con la distancia genómica lineal hasta unos pocos Mb del punto de referencia. Por lo tanto, se espera que la frecuencia de un contacto específico en la vecindad de un locus sea mayor que el fondo de colisiones aleatorias. Un buen indicador de especificidad más allá del rango de Mb es la detección de una interacción dada como grupos de señales de fragmentos de restricción adyacentes.
La resolución de los métodos C viene determinada por la naturaleza de la enzima o enzimas de restricción utilizadas y, en el caso de los métodos que utilizan secuenciación para la detección, también por el número de lecturas de secuenciación. La frecuencia de las secuencias de reconocimiento de una endonucleasa de cuatro pares de bases (pa) es, en principio, dieciséis veces mayor que la frecuencia de la secuencia de reconocimiento de un cortador de seis pa. Se espera que el uso de un cortador de cuatro pa aumente la resolución de los contactos en el rango de Mb, donde se capturan múltiples eventos de ligadura para contactos específicos y colisiones de fondo. Sin embargo, más allá de este rango, donde los grupos de fragmentos de restricción definen regiones de contacto en el rango de decenas a cientos de kb, se espera que la ventaja de usar un cortador de cuatro pa disminuya. Aunque muchos ensayos de todo el genoma han utilizado microarrays dedicados, la secuenciación de alto rendimiento se está convirtiendo en el método de elección para la detección global de uniones de ligadura. La profundidad de secuenciación es una barrera técnica para la resolución en algunos enfoques como Hi-C y ChIA-PET. Las tecnologías basadas en PCR superan esta limitación al amplificar un subconjunto de contactos, con la contrapartida de una cobertura reducida. La naturaleza en parejas de los productos de ligadura impone una relación de poder de dos entre el aumento de la resolución y el aumento de la profundidad de secuenciación requerida. La cobertura genómica por profundidad de secuenciación también depende del tamaño del genoma inspeccionado. Por ejemplo, una potencia de secuenciación similar proporciona decenas de kb de resolución de contacto en levadura, pero solo resolución Mb en el genoma humano.