J'ai un ensemble de données nationales sur environ 1,4 million de ménages. Là, j'ai des informations sur le loyer, la taille (nombre de pièces et m2) et quelques caractéristiques supplémentaires de chaque ménage.
Je voudrais utiliser ces données pour créer une surface de prix des loyers pour l'ensemble du pays et utiliser ces informations comme approximation des valeurs des ~ 1,5 million de ménages restants qui sont propriétaires ou ne disposent pas d'informations sur les loyers.
Quelques questions ici:
Une telle approche est-elle appropriée pour ce type de problème?
Quelle méthode d'interpolation serait la plus appropriée à utiliser ici?
Serait-il également possible de tenir compte, par exemple, de la taille du ménage?
Je suis sur ArcGIS 9.3 avec une licence ArcInfo.
Réponses:
L'idée est bonne mais la mise en œuvre proposée peut être trop simpliste pour être crédible. Les loyers sont la propriété des systèmes économiques. En plus d'être influencés par l'emplacement, ils sont liés à d'autres variables économiques de manière importante: état de l'économie locale (et nationale), prix locaux du logement, disponibilité du capital, taux d'emploi, etc. Pour faire du bon travail, vous avez besoin d'un modèle économétrique . Il pourrait être avantageux de disposer de certains termes de décalage spatial , mais avant d'envisager de telles complications, vous devez inclure bon nombre de ces covariables économiques.
Cela dit, votre capacité à réussir dépend des relations entre les données dont vous disposez et les loyers que vous souhaitez prévoir. Si vos données sont un échantillon représentatif de l'ensemble du pays et sont géographiquement dispersées - considérez les maisons comme des raisins secs sur un cookie et que vous avez des données sur tous les autres raisins secs dans le cookie - alors un modèle relativement simple pourrait suffire. Si vos données sont géographiquement ciblées - peut-être avez-vous des informations sur les raisins secs sur le côté droit du cookie et que vous souhaitez faire des prédictions pour les raisins secs sur le côté gauche - alors le problème est plus difficile.
Un bon point de départ serait d'adapter un modèle économétrique linéaire conventionnel des loyers aux caractéristiques des ménages et aux caractéristiques spatiales brutes (telles que les politiques fiscales des États ou des comtés), de calculer les résidus et de commencer à explorer spatialement les résidus (en utilisant la variographie , les lissages spatiaux du noyau , etc.) pour saisir les effets géographiques.
Un logiciel adapté est disponible en tant que add-ons à R .
la source
Comme une introduction très douce aux sujets sur la régression spatiale, je recommande fortement de consulter le classeur GeoDa (les chapitres 22 à 25 seront les plus intéressants). Même si vous ne souhaitez pas utiliser le logiciel, il s'agit d'un aperçu très complet de la régression spatiale.
Les fonctions de régression intégrées dans ArcMap gèreront-elles autant de données (pas qu'un logiciel aurait du mal avec autant de points?)
la source
J'ai vu des travaux similaires effectués pour les prix des maisons en utilisant la modélisation hédonique. Voir http://scholar.google.com/scholar?hl=en&q=hedonic+price+geography pour des exemples.
la source