Que signifie «toutes choses égales par ailleurs» dans une régression multiple?

22

Lorsque nous effectuons plusieurs régressions et disons que nous examinons le changement moyen de la variable pour un changement d'une variable , en maintenant toutes les autres variables constantes, à quelles valeurs maintenons-nous les autres variables constantes? Leur moyenne? Zéro? De n'importe quelle valeur?yx

J'ai tendance à penser que c'est à n'importe quelle valeur; je cherche juste une clarification. Si quelqu'un avait une preuve, ce serait bien aussi.

EconStats
la source
2
J'ai trouvé l'exemple 10 dans l'article de Peter Kennedy très utile pour comprendre cela.
Dimitriy V. Masterov
Oui, le fait d'augmenter le nombre de pièces tout en maintenant les pieds carrés constants est un point vraiment observateur. Ce document est en fait une mine d'or d'idées utiles, il va dans les notes de doctorat.
EconStats
1
C'est en fait une question très intéressante, je me demande si les économistes se demandent ce que signifie exactement "ceteris paribus".
mugen

Réponses:

26

Vous avez raison. Techniquement, c'est n'importe quelle valeur . Cependant, lorsque j'enseigne cela, je dis généralement aux gens que vous obtenez l'effet d'un changement d'une unité dans Xj lorsque toutes les autres variables sont maintenues à leurs moyennes respectives. Je pense que c'est une façon courante de l'expliquer qui ne me concerne pas.

Je continue généralement à mentionner que si vous n'avez aucune interaction, sera l'effet d'un changement d'une unité dans X j , quelles que soient les valeurs de vos autres variables. Mais j'aime commencer par la formulation moyenne. La raison en est qu'il y a deux effets à inclure plusieurs variables dans un modèle de régression. Tout d'abord, vous obtenez l'effet de X j contrôlant les autres variables (voir ma réponse ici ). La seconde est que la présence des autres variables réduit (typiquement) la variance résiduelle du modèle, rendant vos variables (y compris X jβjXjXjXj) 'plus significatif'. Il est difficile pour les gens de comprendre comment cela fonctionne si les autres variables ont des valeurs qui sont partout. Cela semble augmenter la variabilité d'une manière ou d'une autre. Si vous pensez à ajuster chaque point de données vers le haut ou vers le bas pour la valeur de chaque autre variable jusqu'à ce que toutes les autres variables aient été déplacées vers leurs moyennes respectives, il est plus facile de voir que la variabilité résiduelle a été réduite. X

Je n'arrive pas aux interactions avant une classe ou deux après avoir introduit les bases de la régression multiple. Cependant, quand j'y arrive, je reviens à ce matériel. Ce qui précède s'applique lorsqu'il n'y a pas d' interactions. Quand il y a des interactions, c'est plus compliqué. Dans ce cas, la variable d'interaction [s] est maintenue constante (très précisément) à , et à aucune autre valeur. 0

Si vous voulez voir comment cela se déroule algébriquement, c'est plutôt simple. Nous pouvons commencer par le cas sans interaction. Déterminons le changement de Y lorsque toutes les autres variables sont constantes maintenus à leur moyens respectifs. Sans perte de généralité, disons qu'il ya trois X des variables et nous sommes intéressés à comprendre comment le changement de Y est associée à un changement d' une unité de X 3 , la tenue X 1 et X 2 constante à leurs moyens respectifs: Y^XY^X3X1X2

Y^i=β^0+β^1X¯1+β^2X¯2+β^3X3iY^i=β^0+β^1X¯1+β^2X¯2+β^3(X3i+1) subtracting the first equation from the second: Y^iY^i=β^0β^0+β^1X¯1β^1X¯1+β^2X¯2β^2X¯2+β^3(X3i+1)β^3X3iΔY=β^3X3i+β^3β^3X3iΔY=β^3

Maintenant, il est évident que nous aurions pu mettre n'importe quelle valeur pour et X 2 dans les deux premières équations, tant que nous avons mis la même valeur pour X 1 ( X 2 ) dans les deux. Autrement dit, tant que nous maintenons X 1 et X 2 constants . X1X2X1X2X1X2

D'un autre côté, cela ne fonctionne pas de cette façon si vous avez une interaction. Ici, je montre le cas où il existe un terme d'interaction : X1X3

Y^i=β^0+β^1X¯1+β^2X¯2+β^3X3i +β^4X¯1X3iY^i=β^0+β^1X¯1+β^2X¯2+β^3(X3i+1)+β^4X¯1(X3i+1) subtracting the first equation from the second: Y^iY^i=β^0β^0+β^1X¯1β^1X¯1+β^2X¯2β^2X¯2+β^3(X3i+1)β^3X3i+ β^4X¯1(X3i+1)β^4X¯1X3iΔY=β^3X3i+β^3β^3X3i+β^4X¯1X3i+β^4X¯1β^4X¯1X3iΔY=β^3+β^4X¯1

Dans ce cas, il n'est pas possible de maintenir tout le reste constant. Le terme d'interaction étant fonction de et X 3 , il n'est pas possible de modifier X 3 sans que le terme d'interaction ne change également. Ainsi, β 3 est égale à la variationX1X3X3β^3 associé à un changementune unité àX3uniquement lorsquela variableinteraction (X1) est maintenu à0au lieu de ˉ X 1(ou toute autre valeurmais0), auquel cas le dernier terme de l'équation du bas disparaît. Y^X3 X10X¯10

Dans cette discussion, je me suis concentré sur les interactions, mais plus généralement, le problème est quand il y a une variable qui est fonction d'une autre telle qu'il n'est pas possible de changer la valeur de la première sans changer la valeur respective de l'autre variable . Dans de tels cas, le sens de β jβ^j devient plus compliqué. Par exemple, si vous avez un modèle avec et X 2 j , puis β j est le dérivé d YXjXj2β^j tenant toutes les autres égales et tenantXj=0(voir ma réponseici). D'autres formulations encore plus compliquées sont également possibles. dYdXjXj=0

gung - Réintégrer Monica
la source
1
Merci gung, cette réponse est excellente à deux niveaux. Premièrement, cela répond au point principal qui m'intéressait. Deuxièmement, vous avez prédit quelle serait ma question de suivi, car j'allais demander comment cela a changé avec l'introduction des termes d'interaction. Merci aussi pour le calcul. Je sais que cette question est assez basique mais je pense que vous ne pouvez jamais être trop explicite avec ces concepts.
EconStats
Vous êtes les bienvenus, @EconStats. Il n'y a aucun problème à inclure les mathématiques, parfois cela facilite beaucoup la compréhension de ce qui se passe.
gung - Reinstate Monica
Eh bien, je dois dire que lorsque vous avez soustrait la première équation de la deuxième équation, cela a finalement confirmé mes pensées originales que peu importe les valeurs de X2 et , tant sont les mêmes dans les deux équations. Cela me semble tellement évident, mais je n'avais jamais pensé à calculer le β de cette façon auparavant. Moment précis de l'ampoule pour moi. X3β
EconStats
Vous pouvez également prendre le dérivé de wrt X j et cela vous amènera au même endroit, mais c'est plus facile en mathématiques (essentiellement l'algèbre du lycée), donc il sera accessible à un public plus large. YXj
gung - Rétablir Monica
1
@beetroot, si je vous comprends bien, vous le maintenez juste à un niveau spécifié. (Sinon, vous pourriez poser cette question comme une nouvelle question.)
gung - Réintégrer Monica
8

Le calcul est simple, il suffit de prendre la différence entre 2 modèles avec l'une des variables x modifiée par 1 et vous verrez que peu importe les autres variables (étant donné qu'il n'y a pas d'interactions, de polynômes ou d'autres termes compliquant).

Un exemple:

y[1]=b0+b1×x1+b2×x2

y[2]=b0+b1×(x1+1)+b2×x2

y[2]y[1]=b0b0+b1×x1b1×x1+b1×1+b2×x2b2×x2=b1

Greg Snow
la source
6

Je pense que vous faites référence à la dépendance dans les covariables ( ). Donc, si le modèle est Y = β 0 + β 1 X 1 + β 2 X 2, l'effet de X i sur Y toutes choses égales par ailleurs serait Δ YXi

Y=β0+β1X1+β2X2
XiY pour toutΔXiavec tous les autresXjmaintenus constants à n'importe quelle valeur.ΔYΔXiΔXiXj

Gardez à l'esprit qu'il est possible que et X 2 soient dépendants (par exemple fonctions l'un de l'autre) sans nécessairement montrer une interaction significative dans le modèle linéaire ( β 12 = 0 dans Y = β 0 + β 1 X 1 + β 2 X 2 +X1X2β12=0Y=β0+β1X1+β2X2+β12X1X2

X1N(0,σ12)X2=X12+N(0,σ22)X1X2

cov(X1,X2)=E(X1X2)E(X1)E(X2)
=E[X1(X12+a)]E(X1).E(X12a)withaN(0,σ22)
=E(X13)E(X1.a)0.E(X12a)=000=0

X1X2ΔYΔXiX1ΔYΔXiXiY

ΔYΔXi ) dans une équation différentielle.

Hans Roggeman
la source
Merci Hans, j'essayais en fait d'arriver au point où le gung a fait mais c'est un bon exemple pour quand les deux variables sont dépendantes.
EconStats