Je voudrais connaître la différence entre l'analyse de données de panel et l'analyse de modèle mixte. À ma connaissance, les données de panel et les modèles mixtes utilisent des effets fixes et aléatoires. Si oui, pourquoi portent-ils des noms différents? Ou sont-ils synonymes?
J'ai lu l'article suivant, qui décrit la définition de l'effet fixe, aléatoire et mixte, mais ne répond pas exactement à ma question: quelle est la différence entre les modèles à effet fixe, à effet aléatoire et à effet mixte?
Je serais également reconnaissant à quelqu'un de me renvoyer à une brève référence (environ 200 pages) sur l'analyse de modèles mixtes. Juste pour ajouter, je préférerais une référence de modélisation mixte indépendamment du traitement logiciel. Explication principalement théorique de la modélisation mixte.
Réponses:
Les données de panel et les données de modèle à effets mixtes traitent de variables aléatoires à double indexation . Le premier indice est pour le groupe, le second est pour les individus au sein du groupe. Pour les données de panel, le deuxième indice est généralement le temps, et on suppose que nous observons les individus au fil du temps. Lorsque le temps est le deuxième indice du modèle à effets mixtes, les modèles sont appelés modèles longitudinaux. Le modèle à effets mixtes est mieux compris en termes de régressions à 2 niveaux. (Pour faciliter l'exposition, supposez une seule variable explicative)yij
La régression de premier niveau est la suivante
Ceci est simplement expliqué comme une régression individuelle pour chaque groupe. La régression de deuxième niveau tente d'expliquer la variation des coefficients de régression:
β i = δ 0 + z i 2 δ 1 + v i
Lorsque vous remplacez la deuxième équation par la première, vous obtenez
Les effets fixes sont ce qui est fixe, cela signifie . Les effets aléatoires sont u i et v i .γ0,γ1,δ0,δ1 ui vi
Maintenant, pour les données de panel, la terminologie change, mais vous pouvez toujours trouver des points communs. Les modèles à effets aléatoires de données de panel sont les mêmes que le modèle à effets mixtes avec
β i = δ 0
avec modèle devenant
où sont des effets aléatoires.ui
La différence la plus importante entre le modèle à effets mixtes et les modèles de données de panel est le traitement des régresseurs . Pour les modèles à effets mixtes, ce sont des variables non aléatoires, tandis que pour les modèles de données de panel, on suppose toujours qu'elles sont aléatoires. Cela devient important lors de la définition du modèle à effets fixes pour les données de panneau.xij
Pour le modèle à effets mixtes, on suppose que les effets aléatoires et v i sont indépendants de ε i j et également de x i j et z i , ce qui est toujours vrai lorsque x i j et z i sont fixes. Si nous admettons x i j stochastique, cela devient important. Le modèle à effets aléatoires pour les données de panel suppose donc que x i t n'est pas corrélé avec u i . Mais le modèle à effet fixe qui a la même formeui vi εij xij zi xij zi xij xit ui
Il y a beaucoup d'histoire derrière la terminologie des effets fixes et des effets aléatoires dans l'économétrie des données de panel, que j'ai omise. À mon avis personnel, ces modèles sont mieux expliqués dans Wooldridge " Analyse économétrique des données transversales et de panel ". Autant que je sache, il n'y a pas une telle histoire dans le modèle à effets mixtes, mais d'un autre côté, je viens du milieu de l'économétrie, donc je peux me tromper.
la source
Je comprends que vous recherchez un texte décrivant la théorie de la modélisation mixte sans référence à un progiciel.
Je recommanderais l' analyse multiniveau, une introduction à la modélisation multiniveau de base et avancée par Tom Snijders et Roel Bosker, environ 250pp. Il a un chapitre sur le logiciel à la fin (qui est quelque peu dépassé maintenant) mais le reste est une théorie très accessible.
Je dois cependant dire que je suis d'accord avec la recommandation ci-dessus pour les modèles multiniveaux et longitudinaux utilisant les données de Sophia Rabe-Hesketh et Anders Skrondal. Le livre est très théorique et le composant logiciel n'est vraiment qu'un bel ajout à un texte substantiel. Je n'utilise pas normalement Stata et j'ai le texte assis sur mon bureau et je le trouve extrêmement bien écrit. Elle est cependant beaucoup plus longue que 200pp.
Les textes suivants sont tous rédigés par des experts actuels dans le domaine et seraient utiles à tous ceux qui souhaitent plus d'informations sur ces techniques (bien qu'elles ne correspondent pas spécifiquement à votre demande): [Je ne peux pas créer de lien vers celles-ci car je suis un nouveau utilisateur, désolé]
Hoox, Joop (2010). Analyse, techniques et applications à plusieurs niveaux.
Gelman, A. et Hill, J. (2006) Data Analysis Using Regression and Multilevel / Hierarchical Models.
Singer, J. (2003) Analyse longitudinale appliquée des données: modélisation du changement et de l'événement
Raudenbush, SW et Bryk, A., S. (2002). Modèles linéaires hiérarchiques: applications et méthodes d'analyse des données
Luke, Douglas, (2004). Modélisation à plusieurs niveaux
Je voudrais également seconder le texte de Wooldridge mentionné ci-dessus, ainsi que le texte R, et le Centre universitaire de Bristol pour la modélisation à plusieurs niveaux a un tas de tutoriels et d'informations
la source
Moi aussi, je me suis interrogé sur la différence entre les deux et ayant récemment trouvé une référence sur ce sujet, je comprends que les «données de panel» sont un nom traditionnel pour les ensembles de données qui représentent un «échantillon transversal ou un groupe de personnes interrogées périodiquement sur une temps imparti ". Le "panel" est donc une structure de groupe au sein de l'ensemble de données, et avoir un tel groupe la façon la plus naturelle d'analyser ce type de données est via une approche de modélisation mixte.
Une bonne référence (peu importe si vous "parlez" R ou non) sur la modélisation à effets mixtes est le brouillon d'un (?) Prochain livre de Douglas Bates ( lme4: Modélisation à effets mixtes avec R ).
la source
@mpiktas a donné une réponse complète. Je voudrais également vous suggérons de lire le chapitre 7 de la documentation pour le paquet plm dans R . La discussion des auteurs sur la différence entre les modèles mixtes et les données de panel mérite d'être lue.
la source
Si vous utilisez des modèles Stata, multiniveaux et longitudinaux utilisant Stata de Sophia Rabe-Hesketh et Anders Skrondal, ce serait un bon choix. Selon ce qui vous intéresse exactement, 200 pages pourraient être à peu près correctes.
la source
D'après mon expérience, la justification de l'utilisation de l '«économétrie par panel» est que les estimateurs par panel des «effets fixes» peuvent être utilisés pour contrôler diverses formes de biais variable omis.
Cependant, il est possible d'effectuer ce type d'estimation dans un modèle multiniveau en utilisant une approche de type Mundlak , c'est-à-dire en incluant les moyennes de groupe comme régresseurs supplémentaires. Cette approche supprime la corrélation entre le terme d'erreur et les facteurs omis potentiels au niveau du groupe, révélant le coefficient «intérieur». Cependant, pour une raison que je ne connais pas, cela ne se fait généralement pas en recherche appliquée. Ces diapositives et ce document fournissent une élaboration.
la source