Considérons un modèle d'effets non observés linéaire du type: où est une caractéristique non observée mais invariable dans le temps et est une erreur, et indexer les observations individuelles et le temps, respectivement. L'approche typique dans une régression à effets fixes (FE) serait de supprimer via des variables muettes individuelles (LSDV) / dé-signification ou par première différenciation. c e i t c i
Ce que je me suis toujours demandé: quand vraiment "fixe"?
Cela peut sembler une question triviale, mais permettez-moi de vous donner deux exemples pour ma raison.
Supposons que nous interrogeons une personne aujourd'hui et demander son revenu, le poids, etc. pour que nous obtenons notre . Au cours des 10 prochains jours, nous allons voir cette même personne et nous l'interviewons à nouveau tous les jours, nous avons donc des données de panel pour elle. Devrions-nous traiter les caractéristiques non observées comme fixées pour cette période de 10 jours, alors qu'elles changeront sûrement à un autre moment dans le futur? Dans 10 jours, ses capacités personnelles ne changeront peut-être pas, mais ce sera le cas lorsqu'elle vieillira. Ou demandé d'une manière plus extrême: si j'interroge cette personne toutes les heures pendant 10 heures par jour, ses caractéristiques non observées sont susceptibles d'être fixées dans cet "échantillon", mais quelle est l'utilité?
Supposons maintenant que nous interviewions plutôt une personne tous les mois du début à la fin de sa vie pendant environ 85 ans. Qu'est-ce qui restera fixe dans ce temps? Lieu de naissance, sexe et couleur des yeux très probablement, mais à part cela, je ne peux guère penser à autre chose. Mais plus important encore: que se passe-t-il s'il y a une caractéristique qui change à un seul moment de sa vie, mais le changement est infiniment petit? Alors ce n'est plus un effet fixe car il a changé quand en pratique cette caractéristique est quasi fixe.
D'un point de vue statistique, il est relativement clair de savoir ce qu'est un effet fixe, mais d'un point de vue intuitif, c'est quelque chose que j'ai du mal à comprendre. Peut-être que quelqu'un d'autre a déjà pensé à cela et a proposé un argument sur le moment où un effet fixe est vraiment un effet fixe. J'apprécierais beaucoup d'autres réflexions sur ce sujet.
"all models are wrong, but some are useful"
- George Box .Réponses:
Si vous êtes intéressé par cette formulation pour l'inférence causale sur alors les quantités inconnues représentées par c i doivent seulement être stables pendant la durée de l'étude / des données pour les effets fixes afin d'identifier la quantité causale pertinente.β cje
Si vous craignez que les quantités représentées par ne soient pas stables même pendant cette période, les effets fixes ne feront pas ce que vous voulez. Vous pouvez alors utiliser des effets aléatoires à la place, bien que si vous vous attendez à une corrélation entre c i aléatoire et X i, vous voudriez conditionner c i sur ˉ X i dans une configuration à plusieurs niveaux. Le souci de cette corrélation est souvent l'une des motivations d'une formulation à effets fixes, car dans de nombreuses circonstances (mais pas toutes), vous n'avez pas à vous en préoccuper.cje cje Xje cje X¯je
En bref, votre préoccupation au sujet de la variation des quantités représentées par est très raisonnable, mais surtout parce qu'elle affecte les données pour la période que vous avez plutôt que les périodes que vous auriez pu avoir ou que vous pourriez éventuellement avoir mais pas.cje
la source
La distinction entre un effet fixe et un effet aléatoire n'a généralement aucune implication sur les estimations (Edit: au moins dans les cas simples non corrélés du manuel), outre une question d'efficacité, mais une implication considérable pour les tests.
À des fins de test, la question que vous devriez vous poser est quel est le niveau de bruit que votre signal devrait dépasser? C'est-à-dire à quelle population souhaitez-vous généraliser vos résultats? En utilisant l'exemple (1): devrait-il s'agir de la variabilité sur une même journée, d'une période plus longue ou de la variabilité sur différents individus?
la source
Ce qui peut être considéré comme une marche aléatoire en remontant dans le temps:
Je pourrais deviner pour votre exemple particulier de l'enquête, des questions mesurant les données de type de flux (par exemple le revenu, le poids) peuvent être raisonnables car des promenades aléatoires sur des délais particulièrement courts. Cependant, les données sur le type de stock (comme le nombre de cafés que vous avez bu aujourd'hui ) semblent un peu plus une présomption perverse.
la source