J'ai une question concernant l'utilisation ou non d'un décalage. Supposons un modèle très simple, où vous voulez décrire le nombre (global) de buts au hockey. Vous avez donc des buts, un nombre de parties jouées et une variable factice "attaquant" qui est égale à 1 si le joueur est attaquant et 0 sinon. Alors, lequel des modèles suivants est correctement spécifié?
buts = matchs + attaquant, ou
buts = décalage (jeux) + attaquant
Encore une fois, les buts sont des buts globaux et le nombre de matchs sont des matchs globaux pour un seul joueur. Par exemple, il pourrait y avoir un joueur ramassé qui a 50 buts en 100 matchs et un autre joueur qui a 20 buts en 50 matchs et ainsi de suite.
Que dois-je faire lorsque je souhaite estimer le nombre d'objectifs? Faut-il vraiment utiliser un offset ici?
Références:
Réponses:
Un modèle de décalage modélise les objectifs par match, comme on peut le voir ici:
est équivalent à
est équivalent à
Voir la diapositive 35 ici: http://www.ed.uiuc.edu/courses/EdPsy490AT/lectures/4glm3-ha-online.pdf
Si vous pensez qu'un a + bx est lié au rapport de log des buts aux jeux (le taux), utilisez un décalage. Si vous pensez qu'il y a un effet de jeu plus compliqué, peut-être de l'accumulation d'expérience, ne le faites pas. Pour plus de discussion, voir ceci: http://ezinearticles.com/?The-Exposure-and-Offset-Variables-in-Poisson-Regression-Models&id=2155811
la source
Quelques points simples ne répondant pas directement à votre question sur les compensations:
la source