🧪 Diese Plattform befindet sich in der Beta-Phase. Funktionen können sich ändern und es können Fehler auftreten. Danke für dein Feedback!
spurious_correlation
Eine Scheinkorrelation ist eine statistische Assoziation zwischen zwei Variablen ohne direkte kausale Verbindung, die stattdessen durch eine gemeinsame Ursache, Zufall oder einen gemeinsamen Zeittrend entsteht. Das Internet hat es trivial einfach gemacht, Datensätze nach statistisch signifikanten Scheinkorrelationen zu durchsuchen.
Der Pro-Kopf-Käsekonsum korreliert stark mit Todesfällen durch Bettwäschewickeln (r = 0,95, p < 0,001) in US-Daten von 2000-2009. Beide Variablen zeigen zufällig im selben Zeitraum Aufwärtstrends. Es gibt keinen kausalen Mechanismus.
In einer deutschen Gemeinde steigt die Anzahl der Storchennester und gleichzeitig die Geburtenrate über mehrere Jahrzehnte an. Tatsächlich wachsen ländliche Regionen, in denen beide Phänomene häufiger vorkommen – Störche nisten bevorzugt dort, und Familien auf dem Land bekommen im Schnitt mehr Kinder. Der Storch bringt die Babys also doch nicht.
Eine Social-Media-Analyse zeigt, dass Länder mit hohem Nutella-Verbrauch pro Kopf auch höhere Nobelpreisträger-Quoten aufweisen (r = 0,82). Beide Variablen spiegeln schlicht den allgemeinen Wohlstand und die Stärke des Bildungssystems wider – nicht eine kausale Wirkung von Haselnusscreme auf wissenschaftliche Kreativität.
Binäre (Ja/Nein) Fragen, die ein LLM beantworten muss, um diesen Aspekt zu identifizieren:
Gibt es einen plausiblen Kausalzusammenhang zwischen den korrelierten Variablen?
Typ: binaryKönnte die Korrelation durch eine gemeinsame Ursache (Confounder) erklärt werden, die nicht in der Analyse gemessen wurde?
Typ: binaryKönnte die Korrelation durch einen gemeinsamen Zeittrend entstehen?
Typ: binaryBleibt die Korrelation bestehen, nachdem plausible Confounder und Zeittrends kontrolliert werden?
Typ: binaryEine Scheinkorrelation ist eine statistische Assoziation zwischen zwei Variablen ohne direkte kausale Verbindung, die stattdessen durch eine gemeinsame Ursache, Zufall oder einen gemeinsamen Zeittrend entsteht. Das Internet hat es trivial einfach gemacht, Datensätze nach statistisch signifikanten Scheinkorrelationen zu durchsuchen.
Bei ausreichend vielen Variablen und Zeitreihendaten werden einige durch Zufall korrelieren. Gemeinsame Zeittrends erzeugen artifizielle Korrelationen, die Standard-Signifikanztests überstehen.
Einen plausiblen kausalen Mechanismus fordern, bevor eine Korrelation ernst genommen wird. Zeitreihen differenzieren oder entrenden. Kausalgraphen verwenden, um zu bewerten, ob die beobachtete Assoziation scheinbar sein könnte.
Tyler Vigens Website 'Spurious Correlations' katalogisiert Hunderte von statistisch signifikanten Korrelationen zwischen unverwandten Zeitreihen.
Nutze diese Tools, um diesen Aspekt zu erkennen, zu analysieren oder zu trainieren.