Je suis très confus quant à savoir s'il est légitime d'inclure une variable dépendante retardée dans un modèle de régression. Fondamentalement, je pense que si ce modèle se concentre sur la relation entre le changement de Y et d'autres variables indépendantes, l'ajout d'une variable dépendante décalée dans le côté droit peut garantir que le coefficient avant les autres IV est indépendant de la valeur précédente de Y.
Certains disent que l'inclusion du LDV biaisera à la baisse le coefficient des autres IV. Certains autres disent que l'on peut inclure le LDV, ce qui peut réduire la corrélation série.
Je sais que cette question est assez générale en termes de type de régression. Mais mes connaissances statistiques sont limitées et j'ai vraiment du mal à déterminer si je dois inclure une variable dépendante retardée dans un modèle de régression lorsque l'accent est mis sur le changement de Y au fil du temps.
Existe-t-il d'autres approches pour gérer l'influence des X sur le changement de Y au fil du temps? J'ai également essayé différents scores de changement en DV, mais le R au carré dans cette situation est très faible.
la source
Réponses:
la source
Je recommande deux articles:
Le résultat est que l'inclusion d'une variable dépendante retardée peut avoir une grande influence sur les coefficients des variables restantes. Parfois, cela est approprié (pour les modèles dynamiques de Keele et Kelly) et parfois non. Comme d'autres l'ont dit, il est important de penser au processus modélisé.
la source
L'inclusion de variables dépendantes décalées peut réduire l'occurrence d'autocorrélation résultant d'une erreur de spécification du modèle. Ainsi, la prise en compte des variables dépendantes retardées vous aide à défendre l'existence d'une autocorrélation dans le modèle. La valeur passée affecte le présent dans le modèle, nécessite une base théorique et ajuste le mieux le modèle selon les besoins.
la source
Ce qui m'intrigue dans cette question, c'est de ne pas en savoir plus sur la spécification du modèle ou sa technique d'estimation. Je mentionne que parce que bien que l'utilisation d'un DV retardé parmi les IV puisse être théoriquement importante et méthodologiquement nécessaire, elle peut également introduire une quantité d'endongénéité risquée dans le modèle, en fonction de la relation substantielle entre les variables et les unités de temps et, également, sur l'AR qui peut exister dans le modèle. À moins que vous (et nous) n'ayez plus de détails sur les variables et sur l'estimation, je ne me sentirais pas à l'aise de recommander de retarder la DV à moins que vous ne pensiez à une technique de variable instrumentale ou quelque chose comme l'estimation Arellano-Bond.
Veuillez nous donner plus de détails afin que nous puissions mieux connaître le type de modèle dont nous parlons.
la source
Oui, vous devez vous méfier du biais de Nickell dans une situation de petit T grand N (Nickell, S. (1981). Biais dans les modèles dynamiques à effets fixes. Econometrica: Journal of the Econometric Society, 1417-1426.)
Vous voudrez peut-être regarder les modèles Dynamic Panel Data comme les estimateurs Arellano-Bond ou Blundell-Bond.
la source