Die Organisation des Genoms im Kernraum ist nicht zufällig und beeinflusst Genomfunktionen, einschließlich Transkription, Replikation und Reparatur. Spezifische genomische Regionen, von den gleichen oder verschiedenen Chromosomen, assoziieren häufig physikalisch miteinander und mit Kernstrukturen, was zu einem kompliziert kompartimentierten Kern führt. Beispiele für Genominteraktionen sind die Assoziation eines Enhancers mit einem Promotor oder das Clustering von Genen wie rDNA-Genen im Nukleolus. Genominteraktionen wurden traditionell mit Fluoreszenz-in-situ-Hybridisierung (FISH) untersucht, die die Visualisierung der räumlichen Beziehung zwischen verschiedenen Genen oder Genomregionen ermöglicht. Einschränkungen dieser Methode sind, dass nur bekannte Wechselwirkungen abgefragt werden können, nur sehr wenige Loci in einem Experiment untersucht werden können und die Auflösung auf die Optik des Mikroskops beschränkt ist.
Die Familie der Chromosomenkonformationserfassungstechniken ist eine Reihe biochemischer Ansätze zur Bestimmung der physikalischen Interaktion von Genomregionen. C-Technologie-Ansätze beinhalten ausnahmslos fünf Schritte: (1) Formaldehydfixierung, um Chromatin an Stellen physikalischer Wechselwirkung zu vernetzen, (2) Spaltung von Chromatin durch Restriktionsenzym oder Beschallung, (3) Ligation unter verdünnten Bedingungen, die die Ligation zwischen DNA-Enden, die auf demselben Komplex erfasst wurden, gegenüber Ligationen aus zufälligen Kollisionen begünstigt, (4) Detektion von Ligationsübergängen unter Verwendung variabler molekularbiologischer Schritte in Abhängigkeit von der Variante der Methoden und (5) Computeranalyse zur Bestimmung der Interaktionsfrequenzen, die bei der Ligation des vernetzten Chromatins erfasst wurden.
C-Technologien (3C, 4C, 5C, Hi-C) unterscheiden sich in ihrer Art der Detektion und dem Umfang der Wechselwirkungen, die sie untersuchen können. Die 3C-Methode testet die Interaktion zwischen zwei bekannten Stellen im Genom, 4C ermöglicht die Untersuchung unbekannter Interaktoren einer bekannten Genomsequenz, 5C identifiziert alle Interaktionsbereiche innerhalb einer bestimmten Genomdomäne, und Hi-C untersucht alle auftretenden Interaktionen genomweit unvoreingenommen. Zusätzliche Varianten (ChIA-PET, ChIP-Loop) enthalten einen Proteinfällungsschritt, der die Identifizierung von Genominteraktionen ermöglicht, an denen ein bestimmtes Protein von Interesse beteiligt ist. Die Wahl der Methode hängt stark von der spezifischen Art und dem Umfang der biologischen Fragestellung ab, aber auch von der Verfügbarkeit von Ressourcen, einschließlich der Menge an Ausgangsmaterial und der Sequenzierungskapazität. Viele Derivate der Standard-C-Techniken wurden entwickelt, oft inspiriert von der spezifischen biologischen Fragestellung oder mit dem Ziel, die Spezifität zu verbessern oder den Hintergrund zu reduzieren.
C-Technologien sind populationsbasierte Methoden. Sie erzeugen eher relative Kontaktwahrscheinlichkeiten als absolute Kontaktfrequenzen. Die populationsbasierte Natur beruht auf der Tatsache, dass jeder genomische Locus einen paarweisen Ligationsübergang in einer Zelle ergibt. Um eine hohe Abdeckung und quantitative Bewertung von Kontaktprofilen zu ermöglichen, müssen Tausende bis Millionen von Genomäquivalenten (Zellen), die mehrere Ligationsübergänge enthalten, in jedes Experiment einbezogen und kombiniert werden. Korrelationen zwischen C-Kontakten und DNA-FISH haben gezeigt, dass eine interchromosomale Assoziation, die in 3% -5% der Zellen in einer Population auftritt, in den meisten C-Methoden typischerweise als positiv nachgewiesen wird. Häufigere Assoziationen führen im Allgemeinen zu stärkeren Signalen; Die Signalstärke kann jedoch auch die Affinität der physikalischen Wechselwirkungen und nicht deren Frequenz widerspiegeln.
Ein kritischer Schritt in der Datenanalyse besteht darin, festzustellen, ob eine Interaktion, die als Ligationsübergang erkannt wird, spezifisch ist. Die Kontaktfrequenz nimmt exponentiell ab und ist umgekehrt proportional zur linearen genomischen Entfernung bis zu einigen Mb vom Referenzpunkt entfernt. Daher wird erwartet, dass die Häufigkeit eines bestimmten Kontakts in der Nähe eines Ortes höher ist als der Hintergrund zufälliger Kollisionen. Ein guter Indikator für Spezifität jenseits des Mb-Bereichs ist der Nachweis einer gegebenen Wechselwirkung als Cluster von Signalen benachbarter Restriktionsfragmente.
Die Auflösung von C-Methoden wird durch die Art des/der verwendeten Restriktionsenzyme(s) und, im Falle von Verfahren, die Sequenzierung zum Nachweis verwenden, auch durch die Anzahl der Sequenzierungslesevorgänge bestimmt. Die Frequenz der Erkennungssequenzen einer Vier-Basenpaar (bp)-Endonuklease ist im Prinzip sechzehnmal höher als die Frequenz der Erkennungssequenz einer Sechs-bp-Sequenz. Es wird erwartet, dass die Verwendung eines Vier-BP-Schneiders die Auflösung von Kontakten im Mb-Bereich erhöht, wo mehrere Ligationsereignisse für bestimmte Kontakte und die Hintergrundkollisionen erfasst werden. Jenseits dieses Bereichs, jedoch, wo Cluster von Restriktionsfragmenten Kontaktbereiche im Bereich von zehn bis Hunderten von kb definieren, Es wird erwartet, dass der Vorteil der Verwendung eines Vier-bp-Cutters verringert wird. Obwohl viele genomweite Assays dedizierte Microarrays verwendet haben, wird die Hi-Throughput-Sequenzierung zur Methode der Wahl für den globalen Nachweis von Ligationsübergängen. Sequenzierungstiefe ist eine technische Barriere für die Auflösung in einigen Ansätzen wie Hi-C und ChIA-PET. PCR-basierte Technologien überwinden diese Einschränkung, indem sie eine Teilmenge von Kontakten verstärken, mit dem Kompromiss einer reduzierten Abdeckung. Die paarweise Natur der Ligationsprodukte erzwingt eine Zweierpotenzbeziehung zwischen der Erhöhung der Auflösung und der Erhöhung der erforderlichen Sequenzierungstiefe. Die genomische Abdeckung pro Sequenziertiefe hängt auch von der Größe des untersuchten Genoms ab. Zum Beispiel, Eine ähnliche Sequenzierungsleistung bietet eine Kontaktauflösung von zehn kb in Hefe, aber nur Mb Auflösung im menschlichen Genom.