Quelqu'un pourrait-il offrir des conseils sur la façon d'utiliser l' weights
argument dans la lm
fonction de R ? Supposons, par exemple, que vous tentiez d'adapter un modèle aux données de trafic et que vous disposiez de plusieurs centaines de lignes, chacune représentant une ville (avec une population différente). Si vous vouliez que le modèle ajuste l'influence relative de chaque observation en fonction de la taille de la population, pourriez-vous simplement préciser weights=[the column containing the city's population]
? Est-ce le genre de vecteur qui peut être utilisé weights
? Ou auriez-vous besoin d'utiliser une fonction / package / approche R complètement différente?
Curieux de savoir comment les gens abordent celui-ci - je ne l'ai pas vu dans aucun des didacticiels de modélisation linéaire que j'ai vus là-bas. Merci!
la source
lm
résumé s'ils sont mis à l'échelle vs non ...lm
résumé? Les coefficients ou les erreurs types?Ce que vous proposez devrait fonctionner. Voyez si cela a du sens:
La deuxième ligne produit la même interception et la même pente que la troisième ligne (distincte du résultat de la première ligne), en donnant à une observation relativement deux fois le poids de chacune des deux autres observations, semblable à l'impact de la duplication de la troisième observation.
la source
summary
sorties sont différentes pour la 2e et la 3e ligne, en particulier pour la valeur de p du coefficient, je me demande si cela se produira si les 2 instructions se réfèrent au même ensemble de données. J'ai posté une question à ce sujet sur stackoverflow.com/questions/10268689/weighted-regression-in-r