Berksons Paradoxon: Warum attraktive Menschen weniger nett wirken
Sie stellen fest, dass unter Ihren Dates attraktive Menschen systematisch weniger angenehm sind als weniger attraktive — als gäbe es einen negativen Zusammenhang zwischen Aussehen und Charakter. In der Gesamtbevölkerung existiert diese Korrelation nicht. Was geht hier vor? Das Phänomen hat einen Namen: Berksons Paradoxon. Und es erklärt, wie selektive Stichproben Zusammenhänge aus dem Nichts erschaffen.
Was ist Berksons Paradoxon?
Berksons Paradoxon (englisch: Berkson's paradox oder Berkson's bias) beschreibt eine statistische Erscheinung, bei der zwei unabhängige oder schwach positiv korrelierte Variablen in einer selektiv ausgewählten Teilpopulation negativ miteinander zu korrelieren scheinen.
Benannt ist das Paradoxon nach dem amerikanischen Statistiker und Mediziner Joseph Berkson, der es 1946 in einem Artikel über die Analyse von Krankenhausdaten erstmals beschrieb. Berkson zeigte, dass Krankheiten, die in der Allgemeinbevölkerung unkorreliert sind, in einem Krankenhaus korreliert erscheinen können — einfach weil das Krankenhaus eine spezielle Auswahl von Menschen anzieht.
Formal gehört Berksons Paradoxon zur Familie der Collider-Bias-Phänomene: Eine dritte Variable — die Auswahlbedingung — "kollidiert" auf einen gemeinsamen Effekt beider Variablen und erzeugt dadurch eine statistische Verbindung zwischen ihnen, die in der Grundgesamtheit nicht existiert.
Das Dating-Beispiel: Wie es entsteht
Zurück zu den Dates. Angenommen, Sie würden jemanden nur dann daten, wenn diese Person entweder attraktiv oder angenehm ist — oder beides. Wen lehnen Sie ab? Menschen, die weder attraktiv noch angenehm sind. Das heißt: Unter all Ihren Dates sind überproportional viele Menschen, die mindestens in einer dieser Kategorien punkten.
Jetzt kommt die Falle: Wenn jemand aus Ihrer selektierten Gruppe attraktiv ist, aber Sie haben ihn ins "Ja"-Feld eingeordnet obwohl er wenig angenehm ist — dann erfüllt Attraktivität quasi "alleine" die Bedingung. Umgekehrt: Angenehme Menschen in Ihrer Gruppe sind oft weniger attraktiv, weil Attraktivität allein nicht der Grund für ihre Aufnahme war. Das Ergebnis: In Ihrer selektierten Gruppe erscheint Attraktivität negativ mit Angenehm-Sein korreliert — obwohl in der Gesamtbevölkerung kein solcher Zusammenhang besteht.
Das ist kein Denkfehler, den man durch mehr Aufmerksamkeit vermeidet. Es ist eine mathematische Konsequenz selektiver Stichproben.
Das medizinische Originalproblem: Berksons Krankenhaus
Berkson beschrieb ursprünglich folgenden Fall: Zwei Krankheiten, A und B, sind in der Allgemeinbevölkerung vollständig unkorreliert. Beide haben eine gewisse Wahrscheinlichkeit, ins Krankenhaus einzuliefern. Im Krankenhaus werden nun beide Krankheiten gemeinsam untersucht — aber die Patienten im Krankenhaus sind keine repräsentative Stichprobe der Bevölkerung. Sie sind Menschen, die wenigstens eine der Einweisungsindikationen erfüllen.
Das Ergebnis: Patienten mit Krankheit A sind im Vergleich zu anderen Krankenhauspatienten weniger häufig auch an B erkrankt — und umgekehrt. Im Krankenhaus entsteht eine negative Korrelation zwischen A und B, die in der Bevölkerung nicht existiert. Würde ein Forscher nun ausschließlich Krankenhauspatienten untersuchen, käme er zum falschen Schluss: "Krankheit A schützt vor Krankheit B."
Dieser Fehler ist in der medizinischen Forschungsgeschichte tatsächlich aufgetreten — und hat zu falschen Schlussfolgerungen über Risikofaktoren und Schutzeffekte geführt.
Collider Bias: Das allgemeinere Prinzip
Berksons Paradoxon ist ein Spezialfall des allgemeineren Konzepts des Collider Bias aus der Kausalinferenz-Theorie. Judea Pearl, der die mathematische Grundlage für kausales Denken formalisiert hat, beschreibt einen Collider als eine Variable, die von zwei anderen Variablen gleichzeitig beeinflusst wird.
Wenn wir auf einem Collider konditionieren — d.h., wenn wir nur Beobachtungen aus einer Teilgruppe betrachten, die durch den Collider definiert wird — entsteht eine statistische Abhängigkeit zwischen den Ursachen des Colliders, auch wenn diese Ursachen in der Bevölkerung unabhängig voneinander sind. Das Konditionieren auf einen Collider öffnet einen "nicht-kausalen Pfad" zwischen den Variablen.
In der Sprache von Directed Acyclic Graphs (DAGs), dem Standardwerkzeug moderner Epidemiologie und Kausalinferenz: A → C ← B. Wenn wir auf C kontrollieren, entsteht eine Korrelation zwischen A und B, die ohne diese Kontrolle nicht sichtbar wäre. Das ist strukturell das Gegenteil von Confounding: Während wir beim Confounding auf einen gemeinsamen Vorläufer kontrollieren müssen, dürfen wir beim Collider auf einen gemeinsamen Nachläufer nicht kontrollieren.
Weitere Beispiele aus der Praxis
Überleben-Selektionen in der Wirtschaft
Unter erfolgreichen Unternehmen scheinen Risikobereitschaft und Produktqualität negativ zu korrelieren — riskante Firmen sind oft nicht so hochwertig, qualitätsorientierte Firmen wirken vorsichtiger. Aber warum? Weil wir nur die Überlebenden sehen. Firmen, die weder risikobereit noch qualitätsorientiert waren, sind schon lange weg. Das verzerrt alle Einschätzungen über "was zum Erfolg führt".
Auszeichnungen und spätere Leistung
Akademiker, die einen prestigiösen Preis gewonnen haben, scheinen danach manchmal weniger produktiv zu sein. Eine mögliche Erklärung: Unter den Preisträgern sind (a) echte Ausnahmetalente und (b) Menschen, die zum richtigen Zeitpunkt das richtige Thema hatten. Die "nur richtig getimten" Preisträger beeinflussen den Mittelwert nach unten — eine Form von Selektionsverzerrung.
Studienzulassung
In einer Elite-Universität scheinen Noten und Kreativität negativ zu korrelieren. Der Grund: Wer ohne Top-Noten aufgenommen wurde, hat andere Stärken — Kreativität, außerschulische Leistungen, besondere Talente. Wer mit Top-Noten aufgenommen wurde, hat vielleicht weniger auffällige kreative Merkmale. In der Allgemeinbevölkerung gibt es keinen negativen Zusammenhang zwischen Noten und Kreativität.
Wie man Berksons Paradoxon erkennt
Die Leitfrage lautet: Ist meine Stichprobe repräsentativ für die Grundgesamtheit, über die ich schließen will?
- Wurden Beobachtungen aufgrund einer Eigenschaft ausgewählt, die mit den untersuchten Variablen zusammenhängt?
- Sehe ich nur die "Überlebenden", "Zugelassenen" oder "Behandelten"?
- Könnte die scheinbare Korrelation verschwinden, wenn ich die gesamte relevante Bevölkerung betrachten würde?
- Bin ich dabei, auf einen Collider zu konditionieren — also eine Variable zu kontrollieren, die Konsequenz beider Variablen ist?
Die Verbindung zu anderen Verzerrungen ist deutlich: Störvariablen sind Ursachen, die vor beiden Variablen liegen. Collider sind Effekte, die nach beiden Variablen liegen. Beides ist gefährlich — aber die Verwechslung beider Typen führt zu entgegengesetzten Fehlern in der Analyse.
Zusammenfassung
Berksons Paradoxon zeigt, wie gefährlich es ist, aus selektierten Stichproben auf die Wirklichkeit zu schließen. Die scheinbar negative Korrelation zwischen Attraktivität und Nettigkeit ist kein Zynismus — sie ist Mathematik. Jedes Mal, wenn wir nur einen Ausschnitt der Wirklichkeit sehen — nur Krankenhauspatienten, nur erfolgreiche Unternehmen, nur unsere Dates — laufen wir Gefahr, Zusammenhänge zu sehen, die außerhalb unseres Ausschnitts nicht existieren. Die Antidote: immer fragen, wie die beobachtete Stichprobe zustande kam.
Quellen & Weiterführendes
- Berkson, Joseph. "Limitations of the Application of Fourfold Table Analysis to Hospital Data." Biometrics Bulletin, 2(3), 1946, S. 47–53.
- Pearl, Judea. Causality: Models, Reasoning, and Inference. 2. Aufl., Cambridge University Press, 2009.
- Pearl, Judea & Dana Mackenzie. The Book of Why: The New Science of Cause and Effect. Basic Books, 2018.
- Hernán, Miguel A., Sonia Hernández-Díaz & James M. Robins. "A Structural Approach to Selection Bias." Epidemiology, 15(5), 2004, S. 615–625.
- Griffith, Gareth J. et al. "Collider bias undermines our understanding of COVID-19 disease risk and severity." Nature Communications, 11, 2020, 5749.
- Wikipedia: Berkson-Bias