Apps
EN — EnglishLogin

🧪 Diese Plattform befindet sich in der Beta-Phase. Funktionen können sich ändern und es können Fehler auftreten. Danke für dein Feedback!

P-Hacking (Data Dredging)

Auch bekannt als: Data Dredging Significance Chasing Researcher Degrees of Freedom Exploitation Signifikanz-Jagen
Statistical Error ID: p_hacking

Definition

P-Hacking tritt auf, wenn Forscher Daten wiederholt mit verschiedenen Methoden, Variablenauswahlen oder Untergruppen-Aufteilungen analysieren, bis ein statistisch signifikanter p-Wert (typischerweise unter 0,05) gefunden wird. Diese Ausnutzung von „Researcher Degrees of Freedom“ bläht die Rate falsch-positiver Ergebnisse weit über das nominale Signifikanzniveau auf. Die Praxis kann absichtlich oder unbewusst erfolgen, getrieben durch Publikationsanreize, die signifikante Ergebnisse belohnen.

Beispiele

Ein Pharmaforscher testet ein neues Ergänzungsmittel gegen 20 verschiedene Gesundheitsoutcomes. Ein Ergebnis (Wachstumsrate der Zehennägel) liefert p < 0,05. Die Studie wird unter dem Titel „Präparat X verbessert signifikant das Zehennagelwachstum“ veröffentlicht, ohne die 19 nicht signifikanten Tests zu erwähnen.

Ein Ernährungswissenschaftler untersucht den Effekt eines neuen Tees auf die Gesundheit und misst dabei Blutdruck, Cholesterin, Schlafqualität, Stimmung und zwölf weitere Werte. Nur die Stimmungsmessung ergibt p = 0,04 – und prompt erscheint eine Pressemitteilung: 'Studie belegt: Dieser Tee macht glücklich!'

Ein Social-Media-Forscher analysiert denselben Datensatz über Smartphone-Nutzung immer wieder mit verschiedenen Altersgruppen, Zeiträumen und Definitionen. Erst als er die Gruppe der 23- bis 27-Jährigen an Wochentagen isoliert, findet er ein signifikantes Ergebnis – und veröffentlicht es, ohne die anderen Auswertungen zu erwähnen.

Prüfschritte
Prüfschritte
Binäre Ja/Nein-Fragen, die eine KI beantworten muss, um ein Argumentationsmuster in einem Text zu erkennen.
Jeder der 452 Aspekte hat Prüfschritte — einfache Ja/Nein-Fragen, die systematisch erkennen sollen, ob ein Muster in einem Text vorkommt. Für Ad Hominem: "Greift das Argument eine Person statt ihre Behauptung an?" Für falsche Dichotomie: "Werden nur zwei Optionen präsentiert, obwohl mehr existieren?"

Binäre (Ja/Nein) Fragen, die ein LLM beantworten muss, um diesen Aspekt zu identifizieren:

  1. 1

    Wurden mehrere statistische Analysen oder Variablenkombinationen getestet?

    Typ: binary
  2. 2

    Werden nur die signifikanten Ergebnisse (p < 0,05) berichtet?

    Typ: binary
  3. 3

    Wird die Gesamtzahl der durchgeführten Tests offengelegt?

    Typ: binary
  4. 4

    Wurden Korrekturen für multiples Testen angewendet?

    Typ: binary
Vertiefung
Der aufklappbare Detailbereich auf jeder Aspekt-Seite mit Beispielen, Psychologie und Gegenstrategien.
Der Vertiefungsbereich bietet ausführliche Informationen zu jedem Aspekt: ein Praxisbeispiel, eine Erklärung warum es funktioniert, Tipps wie man entgegnet, alternative Bezeichnungen und Links zu verwandten Aspekten.

Hierarchischer Kontext