Type-II-Fehler (Type 2 Error)

Auch bekannt als: False Negative Beta Error Missed Detection Falsch-negativ Fehler 2. Art

Statistical Error ID: type_2_error

Definition

Ein Type-II-Fehler (falsch-negativ) tritt auf, wenn ein statistischer Test eine falsche Nullhypothese nicht ablehnt und somit einen realen Effekt übersieht. Die Wahrscheinlichkeit eines Type-II-Fehlers wird mit Beta bezeichnet; die statistische Power (1 - Beta) ist die Wahrscheinlichkeit, einen echten Effekt korrekt zu identifizieren. „Unterpowerte“ Studien mit kleinen Stichproben sind besonders anfällig für Type-II-Fehler.

Beispiele

Eine Studie mit nur 30 Teilnehmern testet eine neue Lehrmethode. Der Effekt ist real, aber moderat. Die Studie findet p = 0,12, schließt auf „keinen signifikanten Unterschied“ und die Methode wird verworfen. Eine spätere Studie mit 300 Teilnehmern bestätigt jedoch die Wirksamkeit.

Ein Unternehmen testet ein neues Onboarding-Programm mit einer Pilotgruppe von nur 15 Mitarbeitern. Obwohl das Programm tatsächlich die Produktivität steigert, zeigt die Studie p = 0,18 – das Programm wird als wirkungslos eingestuft und nicht weiter eingesetzt.

Eine Umweltstudie untersucht, ob ein Industriegebiet die Wasserqualität eines nahegelegenen Flusses beeinträchtigt. Aufgrund begrenzter Messungen und hoher natürlicher Schwankungen findet die Studie keinen signifikanten Effekt – dabei ist die Verschmutzung real, aber die Stichprobe zu klein, um sie zuverlässig nachzuweisen.

Prüfschritte

Prüfschritte

Binäre Ja/Nein-Fragen, die eine KI beantworten muss, um ein Argumentationsmuster in einem Text zu erkennen.

Jeder der 452 Aspekte hat Prüfschritte — einfache Ja/Nein-Fragen, die systematisch erkennen sollen, ob ein Muster in einem Text vorkommt. Für Ad Hominem: "Greift das Argument eine Person statt ihre Behauptung an?" Für falsche Dichotomie: "Werden nur zwei Optionen präsentiert, obwohl mehr existieren?"

Im Glossar ansehen →

Binäre (Ja/Nein) Fragen, die ein LLM beantworten muss, um diesen Aspekt zu identifizieren:

1

Wird eine Nullhypothese getestet?
Typ: binary
2

Wird die Nullhypothese beibehalten (kein signifikantes Ergebnis gefunden)?
Typ: binary
3

Könnte ein tatsächlicher Effekt aufgrund zu geringer statistischer Power oder einer zu kleinen Stichprobe übersehen worden sein?
Typ: binary

Beschreibung

Warum es funktioniert

Menschen setzen „kein signifikantes Ergebnis“ oft mit „kein Effekt“ gleich. Das Fehlen von Beweisen wird als Beweis für das Fehlen gewertet, besonders wenn die Studie ansonsten seriös wirkt.

Wie man entgegnet

Prüfe immer die statistische Power einer Studie, bevor du ein Null-Ergebnis akzeptierst. Achte auf Konfidenzintervalle: Ein breites Intervall, das die Null kreuzt, deutet eher auf unzureichende Daten als auf die Abwesenheit eines Effekts hin.

Auch bekannt als

False Negative Beta Error Missed Detection Falsch-negativ Fehler 2. Art

Praxiskontext

Type-II-Fehler sind häufig in frühen klinischen Studien, bei Umweltverträglichkeitsprüfungen und in der Qualitätskontrolle, wenn Inspektionen teuer sind.