🧪 Diese Plattform befindet sich in der Beta-Phase. Funktionen können sich ändern und es können Fehler auftreten. Danke für dein Feedback!
simpsons_paradox
Das Simpsons Paradoxon tritt auf, wenn ein Trend, der in verschiedenen Datengruppen erscheint, sich umkehrt oder verschwindet, wenn diese Gruppen kombiniert werden. Dies geschieht aufgrund einer verborgenen Variablen, welche die Zusammensetzung der Gruppen verändert. Das Paradoxon zeigt, dass aggregierte Daten eine grundlegend andere Geschichte erzählen können als disaggregierte Daten.
Zulassungsdaten einer Universität zeigen, dass Frauen insgesamt seltener zugelassen werden als Männer (scheinbarer Gender-Bias). Doch nach Fachbereichen aufgeschlüsselt werden Frauen in jedem einzelnen Fachbereich gleich häufig oder häufiger zugelassen. Die Umkehrung erfolgt, weil Frauen sich überproportional für hochkompetitive Fachbereiche mit niedrigen Zulassungsraten beworben haben.
Eine Pharmafirma präsentiert Daten, die zeigen, dass ihr neues Medikament insgesamt eine höhere Heilungsrate hat als das alte. Aufgeteilt nach Krankheitsschwere zeigt sich jedoch, dass das alte Medikament bei leichten wie bei schweren Fällen jeweils besser abschneidet – die Gesamtzahlen sind verzerrt, weil das neue Medikament häufiger bei leichteren Fällen eingesetzt wurde.
Statistiken zeigen, dass Radfahrer in einer Stadt insgesamt häufiger in Unfälle verwickelt sind als vor zehn Jahren. Betrachtet man jedoch die Unfallrate pro gefahrenem Kilometer, ist sie in jeder einzelnen Straßenkategorie gesunken. Der Grund: Es gibt schlicht viel mehr Radfahrer, die längere Strecken zurücklegen.
Binäre (Ja/Nein) Fragen, die ein LLM beantworten muss, um diesen Aspekt zu identifizieren:
Werden aggregierte Daten verwendet, um eine Schlussfolgerung zu ziehen?
Typ: binaryKehrt sich der Trend um oder verschwindet er, wenn die Daten in Untergruppen zerlegt werden?
Typ: binaryIst eine Störvariable (Lurking Variable) die Ursache für diese Umkehrung?
Typ: binaryDas Simpsons Paradoxon tritt auf, wenn ein Trend, der in verschiedenen Datengruppen erscheint, sich umkehrt oder verschwindet, wenn diese Gruppen kombiniert werden. Dies geschieht aufgrund einer verborgenen Variablen, welche die Zusammensetzung der Gruppen verändert. Das Paradoxon zeigt, dass aggregierte Daten eine grundlegend andere Geschichte erzählen können als disaggregierte Daten.
Menschen vertrauen aggregierten Statistiken als objektive Zusammenfassungen. Das Paradoxon nutzt die Annahme aus, dass das, was für das Ganze gilt, auch für die Teile gelten muss und umgekehrt.
Untersuche Daten immer auf mehreren Aggregationsebenen. Frage dich, ob sich die Zusammensetzung der Untergruppen signifikant unterscheidet und ob eine Störvariable den beobachteten Trend umkehren könnte.
Berühmt wurde das Simpsons Paradoxon durch den Fall des UC Berkeley Gender-Bias (1973). Es tritt regelmäßig bei medizinischen Behandlungsvergleichen auf, wenn der Schweregrad der Patienten zwischen den Gruppen variiert.
Drawing broad conclusions from limited, unrepresentative, or anecdotal evidence.
Treatment groups differ in baseline risk, confounding the treatment effect.
Excluding a relevant confounding variable from a model biases the estimated effects.
Statistical results change depending on how geographic boundaries are drawn or aggregated.
The presumed effect is actually the cause, reversing the true causal direction.
Random observation of a process is more likely to catch long-duration events than short ones.
Two individually losing strategies can combine to produce a winning strategy.
A group decides on a course of action that no individual member actually wants.
Nutze diese Tools, um diesen Aspekt zu erkennen, zu analysieren oder zu trainieren.