Scheinkorrelation — Wenn Logik sich verkleidet
Eine Scheinkorrelation ist eine statistische Assoziation zwischen zwei Variablen ohne direkte kausale Verbindung, die stattdessen durch eine gemeinsame Ursache, Zufall oder einen gemeinsamen Zeittrend entsteht. Das Internet hat es trivial einfach gemacht, Datensätze nach statistisch signifikanten Scheinkorrelationen zu durchsuchen.
Auch bekannt als: Nonsens-Korrelation, Zufällige Korrelation
Wie es funktioniert
Bei ausreichend vielen Variablen und Zeitreihendaten werden einige durch Zufall korrelieren. Gemeinsame Zeittrends erzeugen artifizielle Korrelationen, die Standard-Signifikanztests überstehen.
Ein klassisches Beispiel
Der Pro-Kopf-Käsekonsum korreliert stark mit Todesfällen durch Bettwäschewickeln (r = 0,95, p < 0,001) in US-Daten von 2000-2009. Beide Variablen zeigen zufällig im selben Zeitraum Aufwärtstrends. Es gibt keinen kausalen Mechanismus.
Wo man das in der Praxis findet
Tyler Vigens Website 'Spurious Correlations' katalogisiert Hunderte von statistisch signifikanten Korrelationen zwischen unverwandten Zeitreihen.
Wie man es erkennt und kontert
Einen plausiblen kausalen Mechanismus fordern, bevor eine Korrelation ernst genommen wird. Zeitreihen differenzieren oder entrenden. Kausalgraphen verwenden, um zu bewerten, ob die beobachtete Assoziation scheinbar sein könnte.
Das Fazit
Scheinkorrelation gehört zu den Denkfehlern, die auf den ersten Blick völlig logisch klingen. Genau das macht sie gefährlich — sie tragen das Kostüm valider Argumentation, während sie eine fehlerhafte Schlussfolgerung einschmuggeln. Die beste Verteidigung? Langsamer werden und fragen: Folgt diese Schlussfolgerung tatsächlich aus diesen Prämissen?