Je commence par ma régression OLS: où D est une variable fictive, les estimations deviennent différentes de zéro avec une faible valeur de p. Je fais ensuite un test Ramsey RESET et constate que j'ai une mauvaise déformation de l'équation, j'inclus donc au carré x: y = β 0 + β 1 x 1 + β 2 x 2 1 + β 3 D + ε
- Qu'est-ce que le terme au carré explique? (Augmentation non linéaire de Y?)
- En faisant cela, mon estimation D ne varie plus de zéro, avec une valeur p élevée. Comment interpréter le terme au carré dans mon équation (en général)?
Edit: Amélioration de la question.
Réponses:
Eh bien, tout d'abord, la variable fictive est interprétée comme un changement d'interception. Autrement dit, votre coefficient vous donne la différence dans l'ordonnée à l'origine lorsque , c'est-à-dire lorsque , l'ordonnée à l'origine est . Cette interprétation ne change pas lors de l'ajout du carré . D = 1 D = 1 β 0 + β 3 x 1β3 D = 1 D = 1 β0+ β3 X1
Maintenant, le point d'ajouter un carré à la série est que vous supposez que la relation se dissipe à un certain point. En regardant votre deuxième équation
Prendre le dérivé par rapport aux rendementsX1
La résolution de cette équation vous donne le tournant de la relation. Comme l'explique l'utilisateur 1493368, cela reflète en effet une forme en U inverse si et vice versa. Prenons l'exemple suivant:β1< 0
La dérivée wrt estX1
La résolution de vous donneX1
C'est le point où la relation a son tournant. Vous pouvez jeter un œil à la sortie de Wolfram-Alpha pour la fonction ci-dessus, pour une visualisation de votre problème.
Rappelez-vous, lorsque vous interprétez l'effet ceteris paribus d'un changement de sur , vous devez regarder l'équation:X1 y
Autrement dit, vous ne pouvez pas interpréter isolément, une fois que vous avez ajouté le régresseur carré !β1 X21
En ce qui concerne votre insignifiant après avoir inclus le carré , il pointe vers un biais de mauvaise spécification.ré X1
la source
Un bon exemple d'inclusion d'un carré de variable provient de l'économie du travail. Si vous supposez en
y
tant que salaire (ou logarithme du salaire) etx
en tant qu'âge, l'inclusionx^2
signifie que vous testez la relation quadratique entre un âge et la rémunération. Le salaire augmente avec l'âge au fur et à mesure que les gens deviennent plus expérimentés, mais à un âge plus élevé, le salaire commence à augmenter à un rythme décroissant (les gens vieillissent et ils ne seront pas en aussi bonne santé pour travailler qu'auparavant) et à un moment donné, le salaire n'augmente pas ( atteint le niveau de salaire optimal) puis commence à baisser (ils prennent leur retraite et leurs gains commencent à diminuer). Ainsi, la relation entre le salaire et l'âge est en U inversé (effet du cycle de vie). En général, pour l'exemple mentionné ici, le coefficient surage
devrait être positif et que surage^2
Le point ici est qu'il devrait y avoir une base théorique / justification empirique pour l'inclusion du carré de la variable. La variable muette, ici, peut être considérée comme représentant le sexe du travailleur. Vous pouvez également inclure le terme d'interaction du sexe et de l'âge pour examiner si la différence de genre varie selon l'âge.la source