🧪 Diese Plattform befindet sich in der Beta-Phase. Funktionen können sich ändern und es können Fehler auftreten. Danke für dein Feedback!
misleading_aggregation
Irreführende Aggregation liegt vor, wenn Daten so kombiniert oder gemittelt werden, dass wichtige Muster oder Unterschiede in Untergruppen unsichtbar werden. Durch das Berichten eines Gesamtdurchschnitts können Ausreißer oder gegensätzliche Trends versteckt werden.
Ein Unternehmen meldet: „Das Durchschnittsgehalt stieg um 15 %.“ In Wahrheit bekam der CEO einen Bonus von 10 Millionen, während alle anderen 500 Mitarbeiter eine Nullrunde machten. Der Mittelwert wurde durch einen Ausreißer nach oben gezogen.
Eine Stadtverwaltung verkündet stolz: 'Die durchschnittliche Wartezeit in unseren Bürgerämtern beträgt nur 18 Minuten.' Tatsächlich warten 80 % der Bürger über 40 Minuten, während eine kleine Gruppe mit Online-Termin in unter 5 Minuten bedient wird – dieser Effekt zieht den Mittelwert nach unten.
Ein Pharmaunternehmen bewirbt ein Medikament mit dem Satz: 'Im Durchschnitt reduzierten Patienten ihren Blutdruck um 12 mmHg.' Verschwiegen wird, dass bei der Hälfte der Patienten gar keine Wirkung eintrat und die starken Effekte bei einer kleinen Untergruppe den Gesamtdurchschnitt nach oben verzerrten.
Binäre (Ja/Nein) Fragen, die ein LLM beantworten muss, um diesen Aspekt zu identifizieren:
Verbergen aggregierte Statistiken (wie der Durchschnitt) wichtige Variationen?
Typ: binaryWürde eine Aufschlüsselung nach relevanten Kategorien das Fazit ändern?
Typ: binaryIst die Verteilung so schief, dass der Mittelwert irreführend ist?
Typ: binaryIrreführende Aggregation liegt vor, wenn Daten so kombiniert oder gemittelt werden, dass wichtige Muster oder Unterschiede in Untergruppen unsichtbar werden. Durch das Berichten eines Gesamtdurchschnitts können Ausreißer oder gegensätzliche Trends versteckt werden.
Aggregierte Zahlen sind einfacher zu verdauen. Das Publikum nimmt an, dass ein Durchschnitt einen „typischen“ Fall repräsentiert, und fragt selten nach der Verteilung.
Verlange neben dem Mittelwert auch den Median und Informationen über die Verteilung. Frage nach Aufschlüsselungen für verschiedene Gruppen.
Dies findet sich oft in Berichten über Wohlstand, bei Schulnoten-Durchschnitten oder bei Unternehmensumsätzen.
Statistical results change depending on how geographic boundaries are drawn or aggregated.
Nearby observations are correlated, violating the independence assumption in standard analyses.
Incorrectly assuming smooth or linear relationships between observed data points.
Nutze diese Tools, um diesen Aspekt zu erkennen, zu analysieren oder zu trainieren.