🧪 Diese Plattform befindet sich in der Beta-Phase. Funktionen können sich ändern und es können Fehler auftreten. Danke für dein Feedback!
collider_bias
Ein statistischer Fehler, der auftritt, wenn die Kontrolle einer Variable (des Colliders), die von zwei anderen Variablen beeinflusst wird, eine künstliche Verbindung zwischen diesen beiden Ursachen herstellt. In einem kausalen Diagramm ist ein Collider ein Punkt, an dem zwei Pfeile zusammenlaufen.
Unter Krankenhauspatienten findet sich oft ein negativer Zusammenhang zwischen zwei unabhängigen Krankheiten, weil jede Krankheit für sich genommen bereits zur Krankenhauseinweisung (Collider) führt.
Ein Casting-Direktor beobachtet, dass bei den Schauspielern, die er engagiert hat, Talent und Aussehen negativ korrelieren – die sehr talentierten sind oft weniger attraktiv und umgekehrt. Dabei sind Talent und Aussehen in der Gesamtbevölkerung unabhängig voneinander; erst die Selektion durch das Casting (Collider) erzeugt diesen scheinbaren Zusammenhang.
In einer Dating-App-Studie wird festgestellt, dass unter den Nutzern, die tatsächlich ein Date hatten, Humor und Attraktivität negativ zusammenhängen. Das liegt daran, dass beide Eigenschaften unabhängig voneinander die Chance auf ein Date (Collider) erhöhen – die Analyse nur dieser Gruppe verzerrt das Bild gegenüber der Gesamtbevölkerung.
Binäre (Ja/Nein) Fragen, die ein LLM beantworten muss, um diesen Aspekt zu identifizieren:
Wird ein statistischer Zusammenhang zwischen zwei Variablen analysiert?
Typ: binaryWird auf eine dritte Variable konditioniert (kontrolliert), die von beiden beeinflusst wird?
Typ: binaryEntsteht dadurch ein Scheinzusammenhang, der ohne diese Kontrolle verschwinden würde?
Typ: binaryEin statistischer Fehler, der auftritt, wenn die Kontrolle einer Variable (des Colliders), die von zwei anderen Variablen beeinflusst wird, eine künstliche Verbindung zwischen diesen beiden Ursachen herstellt. In einem kausalen Diagramm ist ein Collider ein Punkt, an dem zwei Pfeile zusammenlaufen.
Die Konditionierung auf einen gemeinsamen Effekt erzeugt eine mathematische Abhängigkeit zwischen seinen Ursachen. Das ist kontraintuitiv, da das „Kontrollieren für Variablen“ meist als etwas Positives gesehen wird.
Zeichne das kausale Modell auf, bevor du entscheidest, welche Variablen kontrolliert werden sollen.
Epidemiologische Studien, maschinelles Lernen bei der Merkmalsauswahl.
Nutze diese Tools, um diesen Aspekt zu erkennen, zu analysieren oder zu trainieren.