Supposons que vous ayez une seule coupe transversale de données où les individus sont situés au sein de groupes (par exemple, les élèves dans les écoles) et que vous souhaitez estimer un modèle de la forme Y_i = a + B*X_i
où X
est un vecteur de caractéristiques de niveau individuel et a
une constante.
Dans ce cas, supposons que l'hétérogénéité entre groupes non observée biaise vos estimations ponctuelles de B
et leurs ES, car elle est corrélée avec votre variable d'intérêt indépendante.
Une option consiste à regrouper vos SE par groupes (écoles). Une autre consiste à inclure les FE de groupe. Une autre consiste à utiliser les deux. Que faut-il considérer lors du choix entre ces options? Il est particulièrement difficile de comprendre pourquoi on pourrait regrouper les SE par groupe ET utiliser le groupe FE. Dans mon cas particulier, j'ai 35 groupes et 5 000 individus imbriqués dans chaque groupe. J'ai suivi la discussion dans ce pdf , mais il n'est pas très clair pourquoi et quand on pourrait utiliser à la fois des SE groupées et des effets fixes.
(Veuillez discuter des avantages et des inconvénients des SE groupées par rapport aux FE au lieu de suggérer que je correspond simplement à un modèle à plusieurs niveaux.)
la source
Les effets fixes permettent de supprimer l'hétérogénéité non observée entre différents groupes dans vos données.
Je ne suis pas d'accord avec l'implication dans la réponse acceptée selon laquelle la décision d'utiliser un modèle FE dépendra de l'utilisation ou non de "moins de variation". Si votre variable dépendante est affectée par des variables inobservables qui varient systématiquement d'un groupe à l'autre dans votre panel, le coefficient de toute variable corrélée à cette variation sera biaisé. À moins que vos variables X aient été assignées au hasard (et elles ne le seront jamais avec des données d'observation), il est généralement assez facile de faire valoir l'argument des variables omises. Vous pouvezêtre capable de contrôler certaines des variables omises avec une bonne liste de variables de contrôle, mais si une identification forte est votre objectif numéro 1, même une longue liste de contrôles peut laisser aux lecteurs critiques la possibilité de douter de vos résultats. Dans ces cas, il est généralement préférable d'utiliser un modèle à effets fixes.
Les erreurs types groupées servent à prendre en compte les situations dans lesquelles les observations AU SEIN de chaque groupe ne sont pas iid (réparties de manière indépendante et identique).
Un exemple classique est si vous avez de nombreuses observations pour un panel d'entreprises au fil du temps. Vous pouvez tenir compte des effets fixes au niveau de l'entreprise, mais il peut toujours y avoir une variation inexpliquée dans votre variable dépendante qui est corrélée dans le temps. En général, lorsque vous travaillez avec des données de séries chronologiques, il est généralement sûr de supposer une corrélation série temporelle dans les termes d'erreur au sein de vos groupes. Ces situations sont les cas d'utilisation les plus évidents pour les SE groupées.
Quelques exemples illustratifs:
Si vous disposez de données expérimentales où vous attribuez des traitements de manière aléatoire, mais faites des observations répétées pour chaque individu / groupe au fil du temps, vous auriez raison d'omettre les effets fixes, mais vous voudriez regrouper vos SE.
Alternativement, si vous avez de nombreuses observations par groupe pour des données non expérimentales, mais chaque observation intra-groupe peut être considérée comme un tirage iid de leur groupe plus large (par exemple, vous avez des observations de plusieurs écoles, mais chaque groupe est un sous-ensemble tiré au hasard d'élèves de leur école), vous voudriez inclure des effets fixes mais vous n'auriez pas besoin de SE groupées.
la source
Ces réponses sont bonnes, mais la réponse la plus récente et la meilleure est fournie par Abadie et al. (2019) "Quand faut-il ajuster les erreurs standard pour le clustering?" Avec des effets fixes, une raison principale de regrouper est que vous avez une hétérogénéité dans les effets de traitement à travers les grappes. Il existe d'autres raisons, par exemple si les grappes (par exemple, les entreprises, les pays) sont un sous-ensemble des grappes de la population (dont vous parlez). Le regroupement est un problème de conception est le principal message du papier. Ne le faites pas aveuglément.
la source