Genauigkeitsparadoxon — Wenn Logik sich verkleidet
Das Genauigkeitsparadoxon tritt auf, wenn ein Vorhersagemodell mit höherer Gesamtgenauigkeit die eigentliche Aufgabe schlechter erfüllt als ein Modell mit niedrigerer Genauigkeit. Dies geschieht typischerweise bei unausgewogenen Klassen — ein Modell, das immer die Mehrheitsklasse vorhersagt, kann eine sehr hohe Genauigkeit erzielen und dabei für die Erkennung der Minderheitsklasse völlig nutzlos sein.
Auch bekannt als: Accuracy trap, Genauigkeitsfalle
Wie es funktioniert
Die Gesamtgenauigkeit behandelt alle korrekten Vorhersagen gleich, unabhängig von der Klasse. Wenn 99 % der Fälle zu einer Klasse gehören, erreicht ein triviales Modell, das die seltene Klasse ignoriert, 99 % Genauigkeit. Dies verdeckt sein vollständiges Versagen bei der eigentlich wichtigen Aufgabe — der Identifikation seltener, aber bedeutsamer Ereignisse.
Ein klassisches Beispiel
Ein Betrugserkennungssystem klassifiziert 99,5 % aller Transaktionen korrekt, indem es alles als legitim einstuft. Ein konkurrierendes Modell hat nur 95 % Genauigkeit, erkennt aber 80 % der betrügerischen Transaktionen. Das weniger genaue Modell ist trotz seines niedrigeren Genauigkeitswerts weitaus nützlicher.
Wo man das in der Praxis findet
Dieses Paradoxon ist weit verbreitet in der medizinischen Diagnostik (seltene Krankheiten), der Cybersicherheit (Angriffserkennung), der Fertigungsqualitätskontrolle (Fehlererkennung) und in jedem Bereich, in dem das interessierende Ereignis selten, aber folgenschwer ist.
Wie man es erkennt und kontert
Modelle sollten mit klassenspezifischen Metriken wie Präzision, Recall, F1-Score oder der Fläche unter der ROC-Kurve bewertet werden. Konfusionsmatrizen sollten verwendet werden, um die Leistung für jede Klasse einzeln zu überprüfen. Bei unausgewogenen Datensätzen sollte man sich niemals allein auf die Genauigkeit verlassen.
Das Fazit
Genauigkeitsparadoxon gehört zu den Denkfehlern, die auf den ersten Blick völlig logisch klingen. Genau das macht sie gefährlich — sie tragen das Kostüm valider Argumentation, während sie eine fehlerhafte Schlussfolgerung einschmuggeln. Die beste Verteidigung? Langsamer werden und fragen: Folgt diese Schlussfolgerung tatsächlich aus diesen Prämissen?