Räumliche Autokorrelation

Auch bekannt als: Spatial dependence Spatial clustering Räumliche Abhängigkeit

Statistical Error ID: spatial_autocorrelation

Definition

Räumliche Autokorrelation liegt vor, wenn die Werte einer Variable an nahegelegenen Orten ähnlicher (positive Autokorrelation) oder unähnlicher (negative Autokorrelation) sind als zufällig erwartet. Wenn sie in Daten vorliegt, die mit Standardregression analysiert werden, verletzt sie die Annahme unabhängiger Beobachtungen, was zu unterschätzten Standardfehlern, aufgeblähten Teststatistiken und falschem Vertrauen in die Ergebnisse führt. Sie spiegelt Toblers erstes Gesetz der Geographie wider: Alles steht mit allem in Beziehung, aber nahe Dinge stehen in engerer Beziehung.

Beispiele

Eine Studie analysiert Immobilienwerte in einer Stadt mittels Standardregression und findet einen hochsignifikanten Effekt der Parknähe. Allerdings sind Immobilienwerte räumlich autokorreliert — teure Viertel clustern sich unabhängig von Parks. Die Standardfehler sind zu klein und der Parkeffekt wird überschätzt.

Ein Epidemiologe untersucht die Ausbreitung einer Grippewelle und behandelt die Fallzahlen verschiedener Stadtteile als unabhängige Beobachtungen. Da benachbarte Stadtteile jedoch durch Pendlerströme eng verbunden sind, sind ihre Fallzahlen stark räumlich autokorreliert – die Standardfehler des Modells sind zu klein, und vermeintlich signifikante Risikofaktoren erweisen sich als Scheinkorrelationen.

Eine Landwirtschaftsstudie misst Bodennährstoffe auf einem Feld an 50 gleichmäßig verteilten Punkten und wertet die Daten mit klassischen Methoden aus. Da Nährstoffgehalte benachbarter Messpunkte naturgemäß ähnlich sind, verletzen die Daten die Unabhängigkeitsannahme. Die berechneten Konfidenzintervalle für Düngemittelempfehlungen sind dadurch deutlich zu eng.

Prüfschritte

Prüfschritte

Binäre Ja/Nein-Fragen, die eine KI beantworten muss, um ein Argumentationsmuster in einem Text zu erkennen.

Jeder der 452 Aspekte hat Prüfschritte — einfache Ja/Nein-Fragen, die systematisch erkennen sollen, ob ein Muster in einem Text vorkommt. Für Ad Hominem: "Greift das Argument eine Person statt ihre Behauptung an?" Für falsche Dichotomie: "Werden nur zwei Optionen präsentiert, obwohl mehr existieren?"

Im Glossar ansehen →

Binäre (Ja/Nein) Fragen, die ein LLM beantworten muss, um diesen Aspekt zu identifizieren:

1

Befinden sich die Beobachtungen im geografischen Raum und sind potenziell durch Nähe beeinflusst?
Typ: binary
2

Weisen nahe beieinander liegende Beobachtungen ähnlichere Werte auf als entfernte Beobachtungen?
Typ: binary
3

Nimmt die Analyse an, dass die Beobachtungen voneinander unabhängig sind?
Typ: binary
4

Hat die Studie auf räumliche Autokorrelation getestet, etwa mit Morans I oder einem ähnlichen Diagnoseverfahren?
Typ: binary

Beschreibung

Warum es funktioniert

Standard-Statistikmethoden nehmen an, dass jede Beobachtung unabhängige Information liefert. Wenn nahe Beobachtungen korreliert sind, ist die effektive Stichprobengröße kleiner als die tatsächliche, aber Standardmethoden berücksichtigen dies nicht und erzeugen künstlich präzise Schätzungen.

Wie man entgegnet

Testen Sie vor der Analyse auf räumliche Autokorrelation mit Morans I oder Gearys C. Verwenden Sie räumliche Regressionsmodelle (Spatial-Lag- oder Spatial-Error-Modelle), die räumliche Abhängigkeit explizit berücksichtigen. Nutzen Sie räumliche Fixed Effects oder geographisch gewichtete Regression.

Auch bekannt als

Spatial dependence Spatial clustering Räumliche Abhängigkeit

Praxiskontext

Relevant in den Umweltwissenschaften (Schadstoffwerte clustern), der Epidemiologie (Krankheitsausbrüche clustern), der Immobilienanalyse (Immobilienwerte clustern) und der Politikwissenschaft (Wahlmuster clustern geografisch).