Quand utiliser des effets fixes ou utiliser des SE de cluster?

19

Supposons que vous ayez une seule coupe transversale de données où les individus sont situés au sein de groupes (par exemple, les élèves dans les écoles) et que vous souhaitez estimer un modèle de la forme Y_i = a + B*X_iXest un vecteur de caractéristiques de niveau individuel et aune constante.

Dans ce cas, supposons que l'hétérogénéité entre groupes non observée biaise vos estimations ponctuelles de Bet leurs ES, car elle est corrélée avec votre variable d'intérêt indépendante.

Une option consiste à regrouper vos SE par groupes (écoles). Une autre consiste à inclure les FE de groupe. Une autre consiste à utiliser les deux. Que faut-il considérer lors du choix entre ces options? Il est particulièrement difficile de comprendre pourquoi on pourrait regrouper les SE par groupe ET utiliser le groupe FE. Dans mon cas particulier, j'ai 35 groupes et 5 000 individus imbriqués dans chaque groupe. J'ai suivi la discussion dans ce pdf , mais il n'est pas très clair pourquoi et quand on pourrait utiliser à la fois des SE groupées et des effets fixes.

(Veuillez discuter des avantages et des inconvénients des SE groupées par rapport aux FE au lieu de suggérer que je correspond simplement à un modèle à plusieurs niveaux.)

Question Réponse
la source

Réponses:

22

Les deux approches, utilisant des effets fixes de groupe et / ou une erreur standard ajustée en cluster, prennent en compte différents problèmes liés aux données en cluster (ou panel) et je les considérerais clairement comme des approches distinctes. Souvent, vous souhaitez utiliser les deux:

Tout d'abord, l'erreur standard ajustée aux clusters tient compte de la corrélation intra-cluster ou de l'hétéroscédasticité que l'estimateur à effets fixes ne prend pas en compte, sauf si vous êtes prêt à émettre d'autres hypothèses, voir les diapositives Imbens et Wooldridge pour une bonne discussion des courts et de longs panneaux et divers problèmes liés à ce problème . Il y a aussi un article nouveau sur ce sujet par Cameron et Miller: Un guide du praticien pour une inférence robuste aux clusters qui pourrait être intéressant pour vous. Si vous ne voulez pas modéliser la matrice de variance-covariance et que vous soupçonnez la présence d'une corrélation intra-cluster, je conseille d'utiliser l'erreur standard robuste du cluster car le biais dans votre SE peut être sévère (beaucoup plus problématique que pour l'hétéroscédasticité, voirAngrist & Pischke Chapitre III.8 pour une discussion de ce sujet. Mais vous avez besoin de suffisamment de grappes (Angrist et Pischke disent 40-50 comme rôle de pouce). L'erreur standard ajustée au cluster tient compte de l'erreur standard mais ne modifie pas vos estimations ponctuelles (l'erreur standard augmente généralement)!

L'estimation des effets fixes prend en compte l'hétérogénéité invariante dans le temps non observée (comme vous l'avez mentionné). Cela peut être bon ou mauvais: en revanche, vous avez besoin de moins d'hypothèses pour obtenir des estimations cohérentes. D'un autre côté, vous jetez beaucoup de variances qui pourraient être utiles. Certaines personnes comme Andrew Gelman préfèrent la modélisation hiérarchique aux effets fixes, mais ici les opinions diffèrent. L'estimation des effets fixes changera à la fois, l'estimation ponctuelle et l'intervalle (ici aussi l'erreur standard sera généralement plus élevée).

Pour résumer: les erreurs standard robustes aux clusters sont un moyen facile de prendre en compte les problèmes potentiels liés aux données en cluster si vous ne voulez pas vous soucier de la modélisation de la corrélation inter et intra cluster (et qu'il y a suffisamment de clusters disponibles). L'estimation à effets fixes n'utilisera que certaines variations, donc cela dépend de votre modèle si vous voulez faire des estimations basées sur moins de variation ou non. Mais sans hypothèses supplémentaires, l'estimation des effets fixes ne résoudra pas les problèmes liés à la corrélation intra-cluster pour la matrice de variance. L'erreur standard robuste aux grappes ne prendra pas non plus en compte les problèmes liés à l'utilisation de l'estimation à effets fixes.

Arne Jonas Warnke
la source
2
Bonne réponse. La question clé restante est pourquoi on voudrait les DEUX. Imbens et Wooldridge couvrent cela dans une certaine mesure.
QuestionRéponse le
13

Les effets fixes permettent de supprimer l'hétérogénéité non observée entre différents groupes dans vos données.

Je ne suis pas d'accord avec l'implication dans la réponse acceptée selon laquelle la décision d'utiliser un modèle FE dépendra de l'utilisation ou non de "moins de variation". Si votre variable dépendante est affectée par des variables inobservables qui varient systématiquement d'un groupe à l'autre dans votre panel, le coefficient de toute variable corrélée à cette variation sera biaisé. À moins que vos variables X aient été assignées au hasard (et elles ne le seront jamais avec des données d'observation), il est généralement assez facile de faire valoir l'argument des variables omises. Vous pouvezêtre capable de contrôler certaines des variables omises avec une bonne liste de variables de contrôle, mais si une identification forte est votre objectif numéro 1, même une longue liste de contrôles peut laisser aux lecteurs critiques la possibilité de douter de vos résultats. Dans ces cas, il est généralement préférable d'utiliser un modèle à effets fixes.

Les erreurs types groupées servent à prendre en compte les situations dans lesquelles les observations AU SEIN de chaque groupe ne sont pas iid (réparties de manière indépendante et identique).

Un exemple classique est si vous avez de nombreuses observations pour un panel d'entreprises au fil du temps. Vous pouvez tenir compte des effets fixes au niveau de l'entreprise, mais il peut toujours y avoir une variation inexpliquée dans votre variable dépendante qui est corrélée dans le temps. En général, lorsque vous travaillez avec des données de séries chronologiques, il est généralement sûr de supposer une corrélation série temporelle dans les termes d'erreur au sein de vos groupes. Ces situations sont les cas d'utilisation les plus évidents pour les SE groupées.

Quelques exemples illustratifs:

Si vous disposez de données expérimentales où vous attribuez des traitements de manière aléatoire, mais faites des observations répétées pour chaque individu / groupe au fil du temps, vous auriez raison d'omettre les effets fixes, mais vous voudriez regrouper vos SE.

Alternativement, si vous avez de nombreuses observations par groupe pour des données non expérimentales, mais chaque observation intra-groupe peut être considérée comme un tirage iid de leur groupe plus large (par exemple, vous avez des observations de plusieurs écoles, mais chaque groupe est un sous-ensemble tiré au hasard d'élèves de leur école), vous voudriez inclure des effets fixes mais vous n'auriez pas besoin de SE groupées.

Alex P. Miller
la source
2

Ces réponses sont bonnes, mais la réponse la plus récente et la meilleure est fournie par Abadie et al. (2019) "Quand faut-il ajuster les erreurs standard pour le clustering?" Avec des effets fixes, une raison principale de regrouper est que vous avez une hétérogénéité dans les effets de traitement à travers les grappes. Il existe d'autres raisons, par exemple si les grappes (par exemple, les entreprises, les pays) sont un sous-ensemble des grappes de la population (dont vous parlez). Le regroupement est un problème de conception est le principal message du papier. Ne le faites pas aveuglément.

Kishore Gawande
la source