autocorrélation spatiale pour les données de séries chronologiques

11

J'ai un ensemble de données sur 20 ans d'un décompte annuel de l'abondance des espèces pour un ensemble de polygones (~ 200 polygones de forme irrégulière et continue). J'ai utilisé une analyse de régression pour inférer les tendances (changement du nombre par an) pour chaque polygone, ainsi que des agrégations de données de polygone basées sur les limites de gestion.

Je suis sûr qu'il y a une autocorrélation spatiale dans les données, ce qui est sûr d'avoir un impact sur l'analyse de régression pour les données agrégées. Ma question est - comment puis-je exécuter un test SAC pour les données de séries chronologiques? Dois-je regarder le SAC des résidus de ma régression pour chaque année (global Moran's I)? Ou puis-je effectuer un test avec toutes les années?

Une fois que j'ai vérifié que oui, il y a le SAC, y a-t-il eu une solution facile? Mon expérience en statistiques est minime et tout ce que j'ai lu sur la modélisation spatio-temporelle semble très complexe. Je sais que R a une fonction d'autocovariée pondérée en fonction de la distance - est-ce simple à utiliser?

Je suis vraiment très confus sur la façon d'évaluer / d'adresser le SAC pour ce problème et j'apprécierais beaucoup toutes les suggestions, liens ou références. Merci d'avance!

Rozza
la source
1
Souhaitez-vous modéliser les processus spatiaux sous-jacents, ou souhaitez-vous ajuster votre estimation de matrice de variance-covariance pour tenir compte de l'autocorrélation spatiale?
generic_user
1
Ou voulez-vous faire les deux ...
gregmacfarlane
Merci pour vos réponses! Je pense que mes données ont une autodépendance spatiale - elles sont biologiques et très probablement que le nombre d'espèces dans les unités voisines aura un impact sur les unités environnantes. Mes unités sont assez grandes, j'ai donc l'intention d'utiliser simplement l'option `` connexion sur les bords et les coins '' pour définir le décalage de distance pour tester SAC. Les fonctions R pour les modèles SAC semblent réalisables (toujours au-dessus de ma tête!). Merci encore.
Rozza
Bienvenue sur le site Rozza, cela devrait être laissé en commentaire d'une des réponses. Assurez-vous toutefois de noter les réponses existantes si elles ont fourni des réponses utiles, et marquez l'une d'elles comme répondant à votre question si vous pensez qu'elle a été traitée de manière satisfaisante.
Andy W

Réponses:

5

Selon cet article , l'OLS est cohérent en présence d'une autocorrélation spatiale, mais les erreurs standard sont incorrectes et doivent être ajustées. Solomon Hsiang fournit le code stata et matlab pour ce faire. Malheureusement, je ne connais aucun code R pour cela.

Il existe certainement d'autres approches de ce type de problème dans les statistiques spatiales qui modélisent explicitement les processus spatiaux. Celui-ci gonfle simplement les erreurs standard.

Les économétriciens théoriques semblent malheureusement prendre plaisir à obscurcir. Le document lié est vraiment difficile à lire. Fondamentalement, ce qu'il dit est de lancer la régression que vous voulez, puis de corriger les erreurs standard plus tard, c'est-à-dire en utilisant le code de Hsiang. L'espace n'y entre que lorsque vous essayez d'estimer la variance de votre estimateur. Intuitivement, si toute la différence est proche, vous êtes moins certain que votre estimation n'est pas seulement une relique d'un choc spatial non observé.

Notez que vous devez spécifier une bande passante du noyau sur laquelle vous pensez que le processus spatial pourrait fonctionner.

Cette réponse est essentiellement une copie / coller rehash d'une réponse similaire que j'ai faite ici

utilisateur_générique
la source
5

Si le problème est des erreurs autocorrélées, , alors OLS est cohérent mais inefficace, comme le dit ACD. C'est comme la corrélation sérielle dans l'économétrie des séries temporelles.y=Xβ+u,u=ρWu+ϵ

Mais s'il existe une autodépendance spatiale (également appelée autocorrélation, de manière confuse), , alors OLS est incohérent. C'est la même chose qu'un biais variable manquant. Si vous rencontrez les deux problèmes, vous devez utiliser le modèle Spatial Durbin, .y = ρ W y + X β + W X λ + ϵy=ρWy+Xβ+ϵy=ρWy+Xβ+WXλ+ϵ

Le package spdep pour R contient de nombreuses fonctions qui calculent les matrices de pondérations spatiales, estiment les régressions spatiales et font d'autres choses. J'ai beaucoup d'expérience avec les lagsarlmfonctions, mais voyez dans la documentation du paquet qu'il y a une sacsarlmfonction qui semble être plus de ce que vous recherchez.

En ce qui concerne l'aspect temporel de votre problème, les hypothèses que vous faites sur la dépendance contribueront grandement à déterminer la spécification de votre modèle. Vos zones interagissent-elles directement les unes avec les autres? Les marchés commerciaux ou du logement en sont des exemples; les exportations d'un pays dépendent fortement des importations dans un autre et le prix de vente des maisons récemment achetées est une contribution très importante au prix de vente des maisons voisines. Dans ce cas, il est logique de spécifier votre matrice de poids pour tenir compte de cette dépendance. Permettre qu'une maison achetée au temps soit "voisine" avec des maisons au temps , mais pas avec des maisons au temps .t t - 1 t + 1Wtt1t+1

Si vos termes sont corrélés mais ne dépendent pas logiquement les uns des autres, tels que les rendements agricoles, il serait probablement plus logique d'avoir une seule matrice insensible au temps , mais d'inclure des variables muettes pour l'année dans la spécificationXWX

gregmacfarlane
la source
1
Bon post. Je pense que la distinction que le PO doit garder à l'esprit lors du choix entre les deux approches est de savoir si le «résultat» dans un polygone influencera le résultat de ses voisins. Si oui, optez pour l'approche de gmacfarlane. Sinon, celui que je propose est plus simple.
generic_user