Supposons que nous ayons des points dans un espace à deux dimensions, et nous souhaitons mesurer les effets des attributs sur l'attribut . Le modèle de régression linéaire typique est bien sûr
Il y a deux problèmes ici: le premier est que les termes peuvent être spatialement corrélés (violant l'hypothèse d'erreurs indépendantes et identiques), et le second est que la pente de régression peut varier dans l'espace. Le premier problème peut être résolu en incorporant des termes de décalage spatial dans le modèle, comme dans
Nous pouvons même incorporer des variables omises spatialement autorégressives (effets fixes spatiaux) avec le modèle spatial de Durbin décrit dans le texte de LeSage et Pace
où est la force de corrélation spatiale contrôlée par la matrice de poids . Il est clair que la forme du décalage spatial dépendra d'hypothèses sur la forme de la corrélation spatiale.
Le deuxième problème a été résolu en utilisant la «régression pondérée géographiquement» (GWR), une technique que je ne connais pas aussi bien, mais qui est expliquée par Brunsdon, et al. (1998) . Pour autant que je sache, cela implique d'adapter un tableau de modèles de régression à des sous-régions pondérées, obtenant ainsi une estimation de chaque qui change en fonction de son espace, où est une autre matrice de pondérations spatiales, pas nécessairement différente de celle ci-dessus.
Ma question : la première méthode (autorégression spatiale) n'est-elle pas suffisante pour produire une estimation non biaisée de l'effet marginal moyen de sur ? Le GWR semble être trop adapté: bien sûr, les changements dans l'espace, mais si nous voulons connaître l'effet moyen attendu d'un traitement sans tenir compte de sa position spatiale, que pourrait apporter le GWR?
Voici ma tentative de réponse initiale:
- Si je veux connaître la prime pour une chambre supplémentaire dans un quartier spécifique , il semble que GWR serait ma meilleure option.
- Si je veux connaître la prime moyenne globale impartiale pour une chambre supplémentaire, je dois utiliser des techniques autorégressives spatiales.
Aimerait entendre d'autres perspectives.
la source
Réponses:
Je pense que vous répondez correctement à votre propre série de questions.
La recherche sur le marché du logement est normalement abordée en utilisant des modèles non paramétriques.
Pour votre deuxième question, je suis d'accord avec l'utilisation des modèles SAR, et j'irai avec le Durbin pour deux raisons: Premièrement, le modèle Durbin produit des estimations de coefficient non biaisées. Deuxièmement, il est capable de produire des effets d'entraînement qui, par rapport à leur effet direct correspondant, peuvent être différents pour chaque variable explicative.
J'espère que cela t'aides!
la source
Le problème ne vient pas de l'estimation spatiale de Durbin elle-même. Il pourrait être estimé par maximum de vraisemblance et vous pouvez calculer les effets partiels. Le problème se produit lorsque l'effet d'espace n'est pas stationnaire dans dgp, de sorte que vous ne pouvez pas correctement modéliser son effet de cette façon. GWR effectue de nombreuses régressions sur votre espace, vous fournissant ainsi un vecteur de coefficients sur votre espace. Les inférences statistiques sur ces coefficients ne sont pas simples mais elles apparaissent bien sur une carte comme outil d'exploration. Donc, pour découvrir la prime d'une chambre supplémentaire dans un quartier spécifique, votre meilleur pari serait probablement d'exécuter une régression spatiale distincte sur ce quartier. Pour trouver la prime d'une chambre supplémentaire à l'échelle mondiale, utilisez également la régression spatiale, mais n'oubliez pas que les coefficients ne sont pas linéaires dans les paramètres avec de telles régressions;
la source