Siebverzerrung — Wenn Logik sich verkleidet
Siebverzerrung tritt auf, wenn Daten mehrere Filter- oder Selektionsschritte durchlaufen, von denen jeder eine eigene subtile Verzerrung einführen kann. Während ein einzelner Filter möglicherweise nur einen geringen Effekt hat, kann das kumulative Ergebnis sukzessiver Filterung eine Endstichprobe erzeugen, die tiefgreifend unrepräsentativ für die ursprüngliche Population ist. Die kompoundierende Natur sequenzieller Selektion macht die Gesamtverzerrung viel größer und schwerer vorhersagbar, als es jeder einzelne Schritt vermuten ließe.
Auch bekannt als: Cascading selection bias, Sequential filtering bias, Sieve Bias
Wie es funktioniert
Jedes Filterkriterium erscheint für sich genommen vernünftig, und Forschende verfolgen möglicherweise nicht, wie sich die Stichprobenzusammensetzung über alle Schritte hinweg verändert. Der kombinierte Effekt vieler kleiner Verzerrungen ist nicht offensichtlich und kann radikal verändern, wer in der Studie verbleibt, ohne dass jemand die kumulative Verzerrung bemerkt.
Ein klassisches Beispiel
Eine klinische Studie beginnt mit 10.000 Patienten, beschränkt sich dann auf diejenigen, die Aufnahmeformulare ausgefüllt haben (Ausschluss der Schwerstkranken), dann auf solche mit Follow-up-Daten (Ausschluss von Abbrechern wegen Nebenwirkungen), dann auf solche mit vollständigen Laborergebnissen (Ausschluss der Ärmsten). Die verbleibenden 2.000 Patienten sind gesünder, wohlhabender und therapietreuer als die ursprüngliche Population.
Wo man das in der Praxis findet
Häufig in klinischen Studien mit strengen Einschlusskriterien, Data-Science-Pipelines mit mehreren Bereinigungsschritten, Einstellungsprozessen mit sequenziellen Screening-Runden und systematischen Reviews mit mehrstufiger Studienauswahl.
Wie man es erkennt und kontert
Dokumentieren Sie Stichprobengröße und -zusammensetzung bei jedem Filterschritt. Erstellen Sie Flussdiagramme, die den Schwund zeigen. Vergleichen Sie die Merkmale ein- und ausgeschlossener Teilnehmender in jeder Phase. Verwenden Sie multiple Imputation oder inverse Wahrscheinlichkeitsgewichtung, um systematische Ausfälle zu berücksichtigen.
Das Fazit
Siebverzerrung gehört zu den Denkfehlern, die auf den ersten Blick völlig logisch klingen. Genau das macht sie gefährlich — sie tragen das Kostüm valider Argumentation, während sie eine fehlerhafte Schlussfolgerung einschmuggeln. Die beste Verteidigung? Langsamer werden und fragen: Folgt diese Schlussfolgerung tatsächlich aus diesen Prämissen?