社会科学において理論から導出された因果関係の経験的検定がより重要になるにつれて、観測データに依存する研究者は、因果効果を推定するためのデータセットの不十分さに直面している。 実験計画とは異なり、研究者は偏った結果につながる治療の割り当てに影響を与えることはできません。 例えば、より才能のある人をトレーニングプログラムに(自己)選択することは、参加者と非参加者を単純に比較するとき、プログラムの効率の推定に影響
統計的マッチングは、”統計的双生児”を見つけることによって、この問題の解決策を提供します。 しかし、最も一般的なマッチング手法である傾向スコアマッチングは、適用が遅く、適用が困難です。 Coarsened Exact Matching(CEM)は、より速く理解しやすい代替ソリューションを提供します。 これは、研究者のアイデア(すなわち、正確な誕生日ではなく粗い年齢層で)に従ってデータを一時的に粗くし、完全一致を見つけます。 しかし、このスピードとシンプルさの向上は、妥当性の欠如に対して交換されていますか?