Lindley-Paradoxon — Wenn Logik sich verkleidet
Das Lindley-Paradoxon tritt auf, wenn frequentistische und Bayes'sche statistische Methoden aus denselben Daten widersprüchliche Schlussfolgerungen ziehen. Konkret kann ein Ergebnis in einem frequentistischen Test statistisch signifikant sein (niedriger p-Wert), während die Bayes'sche A-posteriori-Wahrscheinlichkeit stark für die Nullhypothese spricht. Diese Diskrepanz wird mit zunehmender Stichprobengröße ausgeprägter.
Auch bekannt als: Lindley-Jeffreys paradox, Jeffreys-Lindley paradox, Lindley-Jeffreys-Paradoxon, Jeffreys-Lindley-Paradoxon
Wie es funktioniert
Bei großen Stichproben können frequentistische Tests beliebig kleine Effekte erkennen und signifikante p-Werte für praktisch bedeutungslose Unterschiede liefern. Die Bayes'sche Analyse bestraft vage Alternativhypothesen, weil die Likelihood dünn über den Parameterraum verteilt ist, sodass die präzise Nullhypothese vergleichsweise mehr Unterstützung erhält.
Ein klassisches Beispiel
Eine klinische Studie mit 100.000 Teilnehmern findet einen Behandlungseffekt von 0,01 Einheiten mit p = 0,03. Der Frequentist verwirft die Nullhypothese. Eine Bayes'sche Analyse mit einem vernünftigen Prior kommt jedoch zu dem Schluss, dass die Nullhypothese mit 95 % Wahrscheinlichkeit zutrifft, weil der beobachtete Effekt so gering ist, dass er eher mit Rauschen als mit einem echten Effekt auf der Skala des Priors vereinbar ist.
Wo man das in der Praxis findet
Dieses Paradoxon tritt häufig in großangelegten epidemiologischen Studien, in der Genomik (genomweite Assoziationsstudien mit Millionen von Datenpunkten) und in der sozialwissenschaftlichen Forschung mit Big Data auf, wo winzige Effekte routinemäßig statistische Signifikanz erreichen.
Wie man es erkennt und kontert
Neben p-Werten sollten Effektgrößen berichtet werden. Bei großen Stichproben sollten Bayes'sche Ansätze oder Bayes-Faktoren in Betracht gezogen werden. Es sollte bewertet werden, ob ein statistisch signifikantes Ergebnis auch praktisch bedeutsam ist. Prior-Annahmen und die Unterscheidung zwischen statistischer und inhaltlicher Signifikanz sollten explizit gemacht werden.
Das Fazit
Lindley-Paradoxon gehört zu den Denkfehlern, die auf den ersten Blick völlig logisch klingen. Genau das macht sie gefährlich — sie tragen das Kostüm valider Argumentation, während sie eine fehlerhafte Schlussfolgerung einschmuggeln. Die beste Verteidigung? Langsamer werden und fragen: Folgt diese Schlussfolgerung tatsächlich aus diesen Prämissen?