Algorithmischer Bias — Wenn Logik sich verkleidet
Algorithmischer Bias ist ein technisches statistisches Problem, das entsteht, wenn Machine-Learning-Modelle historische Verzerrungen in Trainingsdaten kodieren und perpetuieren. Dies geschieht durch verzerrte Trainingsdaten, Proxy-Variablen, die mit geschützten Merkmalen korrelieren, und Rückkopplungsschleifen.
Auch bekannt als: ML-Modellbias, Statistische Diskriminierung
Wie es funktioniert
Daten spiegeln historische soziale Strukturen wider. Wenn diese Strukturen Diskriminierung kodieren, reproduzieren auf historischen Daten optimierte Modelle die Diskriminierung. Das mathematische Erscheinungsbild von Objektivität verschleiert die in Trainingsdaten eingebetteten normativen Entscheidungen.
Ein klassisches Beispiel
Ein Rückfallvorhersage-Algorithmus (COMPAS) wurde auf historischen Verhaftungsdaten trainiert. Da Minderheitsangeklagte historisch aufgrund diskriminierender Polizeiarbeit häufiger verhaftet wurden, wies der Algorithmus Minderheitsangeklagten mit ähnlichen tatsächlichen Rückfallraten höhere Risikobewertungen zu als weißen Angeklagten.
Wo man das in der Praxis findet
Gesichterkennungssysteme, die überwiegend auf hellhäutigen Gesichtern trainiert wurden, zeigen dramatisch höhere Fehlerraten bei dunkelhäutigeren Frauen (MIT Media Lab-Studie, Buolamwini & Gebru, 2018).
Wie man es erkennt und kontert
Trainingsdaten auf Repräsentativität prüfen. Modellleistung separat für demografische Untergruppen messen. Fairness-Einschränkungen bei der Optimierung anwenden. Kausale Modelle verwenden.
Das Fazit
Algorithmischer Bias gehört zu den Denkfehlern, die auf den ersten Blick völlig logisch klingen. Genau das macht sie gefährlich — sie tragen das Kostüm valider Argumentation, während sie eine fehlerhafte Schlussfolgerung einschmuggeln. Die beste Verteidigung? Langsamer werden und fragen: Folgt diese Schlussfolgerung tatsächlich aus diesen Prämissen?