Simpsons Paradoxon (Simpson's Paradox) — Wenn Logik sich verkleidet
Das Simpsons Paradoxon tritt auf, wenn ein Trend, der in verschiedenen Datengruppen erscheint, sich umkehrt oder verschwindet, wenn diese Gruppen kombiniert werden. Dies geschieht aufgrund einer verborgenen Variablen, welche die Zusammensetzung der Gruppen verändert. Das Paradoxon zeigt, dass aggregierte Daten eine grundlegend andere Geschichte erzählen können als disaggregierte Daten.
Auch bekannt als: Reversal Paradox, Amalgamation Paradox, Yule-Simpson Effect
Wie es funktioniert
Menschen vertrauen aggregierten Statistiken als objektive Zusammenfassungen. Das Paradoxon nutzt die Annahme aus, dass das, was für das Ganze gilt, auch für die Teile gelten muss und umgekehrt.
Ein klassisches Beispiel
Zulassungsdaten einer Universität zeigen, dass Frauen insgesamt seltener zugelassen werden als Männer (scheinbarer Gender-Bias). Doch nach Fachbereichen aufgeschlüsselt werden Frauen in jedem einzelnen Fachbereich gleich häufig oder häufiger zugelassen. Die Umkehrung erfolgt, weil Frauen sich überproportional für hochkompetitive Fachbereiche mit niedrigen Zulassungsraten beworben haben.
Wo man das in der Praxis findet
Berühmt wurde das Simpsons Paradoxon durch den Fall des UC Berkeley Gender-Bias (1973). Es tritt regelmäßig bei medizinischen Behandlungsvergleichen auf, wenn der Schweregrad der Patienten zwischen den Gruppen variiert.
Wie man es erkennt und kontert
Untersuche Daten immer auf mehreren Aggregationsebenen. Frage dich, ob sich die Zusammensetzung der Untergruppen signifikant unterscheidet und ob eine Störvariable den beobachteten Trend umkehren könnte.
Das Fazit
Simpsons Paradoxon (Simpson's Paradox) gehört zu den Denkfehlern, die auf den ersten Blick völlig logisch klingen. Genau das macht sie gefährlich — sie tragen das Kostüm valider Argumentation, während sie eine fehlerhafte Schlussfolgerung einschmuggeln. Die beste Verteidigung? Langsamer werden und fragen: Folgt diese Schlussfolgerung tatsächlich aus diesen Prämissen?