Quand un effet fixe est-il vraiment fixe?

12

Considérons un modèle d'effets non observés linéaire du type: où est une caractéristique non observée mais invariable dans le temps et est une erreur, et indexer les observations individuelles et le temps, respectivement. L'approche typique dans une régression à effets fixes (FE) serait de supprimer via des variables muettes individuelles (LSDV) / dé-signification ou par première différenciation. c e i t c i

yit=Xitβ+ci+eit
ceitci

Ce que je me suis toujours demandé: quand vraiment "fixe"?ci

Cela peut sembler une question triviale, mais permettez-moi de vous donner deux exemples pour ma raison.

  1. Supposons que nous interrogeons une personne aujourd'hui et demander son revenu, le poids, etc. pour que nous obtenons notre . Au cours des 10 prochains jours, nous allons voir cette même personne et nous l'interviewons à nouveau tous les jours, nous avons donc des données de panel pour elle. Devrions-nous traiter les caractéristiques non observées comme fixées pour cette période de 10 jours, alors qu'elles changeront sûrement à un autre moment dans le futur? Dans 10 jours, ses capacités personnelles ne changeront peut-être pas, mais ce sera le cas lorsqu'elle vieillira. Ou demandé d'une manière plus extrême: si j'interroge cette personne toutes les heures pendant 10 heures par jour, ses caractéristiques non observées sont susceptibles d'être fixées dans cet "échantillon", mais quelle est l'utilité?X

  2. Supposons maintenant que nous interviewions plutôt une personne tous les mois du début à la fin de sa vie pendant environ 85 ans. Qu'est-ce qui restera fixe dans ce temps? Lieu de naissance, sexe et couleur des yeux très probablement, mais à part cela, je ne peux guère penser à autre chose. Mais plus important encore: que se passe-t-il s'il y a une caractéristique qui change à un seul moment de sa vie, mais le changement est infiniment petit? Alors ce n'est plus un effet fixe car il a changé quand en pratique cette caractéristique est quasi fixe.

D'un point de vue statistique, il est relativement clair de savoir ce qu'est un effet fixe, mais d'un point de vue intuitif, c'est quelque chose que j'ai du mal à comprendre. Peut-être que quelqu'un d'autre a déjà pensé à cela et a proposé un argument sur le moment où un effet fixe est vraiment un effet fixe. J'apprécierais beaucoup d'autres réflexions sur ce sujet.

Andy
la source
2
+1, bonne question et bonnes réponses. Peut-être vaut-il la peine de s'en souvenir, "all models are wrong, but some are useful"- George Box .
gung - Rétablir Monica
Je suis probablement confus à ce sujet, mais ce n'est pas le continuum: 1) si est traité comme le même pour tout i , vous avez un modèle groupé, 2) si c i est traité comme le même pour tout z j [ i ] (variables muettes pour les groupes, qui pourraient inclure "année" ou "jour"), vous avez un modèle FE, et 3) si c j [ i ] est traité comme une distribution, vous avez un modèle RE. Voir: userwww.service.emory.edu/~tclark7/randomeffects.pdf . ciicizj[i]cj[i]
Wayne

Réponses:

9

Si vous êtes intéressé par cette formulation pour l'inférence causale sur alors les quantités inconnues représentées par c i doivent seulement être stables pendant la durée de l'étude / des données pour les effets fixes afin d'identifier la quantité causale pertinente. βci

Si vous craignez que les quantités représentées par ne soient pas stables même pendant cette période, les effets fixes ne feront pas ce que vous voulez. Vous pouvez alors utiliser des effets aléatoires à la place, bien que si vous vous attendez à une corrélation entre c i aléatoire et X i, vous voudriez conditionner c i sur ˉ X i dans une configuration à plusieurs niveaux. Le souci de cette corrélation est souvent l'une des motivations d'une formulation à effets fixes, car dans de nombreuses circonstances (mais pas toutes), vous n'avez pas à vous en préoccuper.ciciXiciX¯i

En bref, votre préoccupation au sujet de la variation des quantités représentées par est très raisonnable, mais surtout parce qu'elle affecte les données pour la période que vous avez plutôt que les périodes que vous auriez pu avoir ou que vous pourriez éventuellement avoir mais pas.ci

conjugateprior
la source
+1 J'aime cette réponse. Mais qu'en est-il d'un changement incroyablement petit dans quelque chose qui est censé être fixé au cours de la période d'échantillonnage? Si ma personne dans l'échantillon de 10 jours frappe sa tête le jour 6 et est ensuite moins intelligente par une quantité infinitésimale représentée par les cellules cérébrales qui sont mortes (juste un exemple trivial): sa capacité peut-elle encore être traitée comme un effet fixe si elle est presque fixe?
Andy
1
Sûr. Peut-être pensez-vous comme ceci: c'est le paramètre qui est fixe et il peut représenter quelque chose dans le monde qui est «vraiment» constant, ou il peut ne pas ex. S'il représente la moyenne de quelque chose qui varie réellement. La question est: quelle différence inférentielle cela fait-il de mettre un effet fixe plutôt que quelque chose d'autre. Dans le cas de l'inférence causale, la question est la suivante: l'hypothèse d'effets fixes diminue-t-elle davantage la confusion que les petites variations non capturées par le paramètre augmentent-elles la confusion?
conjugateprior
@Andy: Une fois que vous commencez à parler d'une bosse à la tête modifiant le QI de quelqu'un parce que quelques cellules cérébrales ont été traumatisées, où cela s'arrête-t-il? Rien de ce que vous mesurez dans le monde réel n'est si fixe qu'il ne change pas (infinitésimalement) d'un instant à l'autre, si vous pouvez le mesurer avec suffisamment de précision. Vous devez simplement faire preuve d'un jugement raisonnable et être explicite à propos de ce jugement lorsque vous énoncez vos résultats. Comme le dit conjugateprior, les effets fixes sont également un concept distinct de "immuable" et se réfèrent à la fois à une chose spécifique (paramètres) et à votre objectif spécifique (population, groupe, etc.).
Wayne
Vous avez raison, l'exemple avec les cellules cérébrales est quelque peu tiré par les cheveux. Je voulais juste réfléchir davantage à la nature des effets fixes car la plupart des manuels et des conférences sont plutôt silencieux sur cet aspect intuitif. Bien sûr, ils donnent des exemples, mais aucun ne répondrait à mes questions. À cette fin, j'ai trouvé très utile de soulever cette question ici et les réponses et commentaires jusqu'à présent ont été très utiles.
Andy
2

La distinction entre un effet fixe et un effet aléatoire n'a généralement aucune implication sur les estimations (Edit: au moins dans les cas simples non corrélés du manuel), outre une question d'efficacité, mais une implication considérable pour les tests.

À des fins de test, la question que vous devriez vous poser est quel est le niveau de bruit que votre signal devrait dépasser? C'est-à-dire à quelle population souhaitez-vous généraliser vos résultats? En utilisant l'exemple (1): devrait-il s'agir de la variabilité sur une même journée, d'une période plus longue ou de la variabilité sur différents individus?

E(ciE(ci)Xi

JohnRos
la source
X
cXc
ciE(ci)
@Andy: Je ne vois pas de raison de ne pas autoriser les corrélations entre les effets et le bruit dans RE, mais si nous sommes d'accord sur le reste de la réponse, je modifie plutôt simplement ma réponse.
JohnRos
2

Xitβ

yit=ci+eit

Ce qui peut être considéré comme une marche aléatoire en remontant dans le temps:

yit=ci+eityit1=ci+eit1yityit1=eiteit1

Xitβeit

ci

Je pourrais deviner pour votre exemple particulier de l'enquête, des questions mesurant les données de type de flux (par exemple le revenu, le poids) peuvent être raisonnables car des promenades aléatoires sur des délais particulièrement courts. Cependant, les données sur le type de stock (comme le nombre de cafés que vous avez bu aujourd'hui ) semblent un peu plus une présomption perverse.

Andy W
la source
+1 Merci pour le lien et votre réponse! Je suis heureux que cette question suscite toujours de l'intérêt et que l'on puisse y ajouter davantage. C'était perspicace.
Andy