som empiriske tester av årsakssammenheng avledet fra teorier blir viktigere i samfunnsvitenskapene, blir forskere som stoler på observasjonsdata konfrontert med utilstrekkelighet av datasettene for å estimere årsakssammenheng. I motsetning til eksperimentelle design kan forskere ikke påvirke tildelingen av behandlingen, noe som fører til partiske resultater. For eksempel påvirker (selv) utvalget av mer talentfulle mennesker i treningsprogrammer estimeringen av programmets effektivitet, når vi bare sammenligner deltakere med ikke-deltakere.
Statistisk matching gir en løsning på dette problemet ved å finne «statistiske tvillinger», en med og en uten behandling. Den vanligste matchende teknikk, Tilbøyelighet Score Matching, derimot, er treg og vanskelig å bruke. Coarsened Exact Matching (CEM) tilbyr en alternativ løsning, som er raskere og enklere å forstå. Det grover midlertidig dataene i henhold til forskernes ideer (dvs. i grove aldersgrupper i stedet for eksakte fødselsdager) og finner deretter eksakte treff. Ennå, er denne gevinsten i fart og enkelhet utveksles mot en mangel på gyldighet?