En termes simples, comment expliqueriez-vous (peut-être avec des exemples simples) la différence entre les modèles à effets fixes, à effets aléatoires et à effets mixtes?
269
En termes simples, comment expliqueriez-vous (peut-être avec des exemples simples) la différence entre les modèles à effets fixes, à effets aléatoires et à effets mixtes?
Réponses:
Le statisticien Andrew Gelman affirme que les termes «effet fixe» et «effet aléatoire» ont des significations variables en fonction de leur utilisateur. Peut-être pourrez-vous choisir laquelle des 5 définitions s’applique à votre cas. En général, il peut être préférable de rechercher des équations décrivant le modèle de probabilité que les auteurs utilisent (lors de la lecture) ou d'écrire le modèle de probabilité complet que vous souhaitez utiliser (lors de l'écriture).
la source
(4) “If an effect is assumed to be a realized value of a random variable, it is called a random effect.” (LaMotte, 1983)
Il existe de bons livres sur ce sujet, tels que Gelman et Hill . Ce qui suit est essentiellement un résumé de leur perspective.
Tout d'abord, vous ne devriez pas vous perdre dans la terminologie. En statistique, le jargon ne devrait jamais être utilisé comme substitut à une compréhension mathématique des modèles eux-mêmes. Cela est particulièrement vrai pour les modèles à effets aléatoires et à effets mixtes. "Mixte" signifie simplement que le modèle a des effets fixes et aléatoires, nous allons donc nous concentrer sur la différence entre fixe et aléatoire.
Effets aléatoires ou fixes
Supposons que vous disposiez d'un modèle avec un prédicteur catégorique, qui divise vos observations en groupes en fonction des valeurs de catégorie. * Les coefficients du modèle, ou "effets", associés à ce prédicteur, peuvent être fixes ou aléatoires. La différence pratique la plus importante entre les deux est la suivante:
Les effets aléatoires sont estimés avec la mise en commun partielle, alors que les effets fixes ne le sont pas.
La mise en commun partielle signifie que, si vous avez peu de points de données dans un groupe, l'estimation de l'effet du groupe sera partiellement basée sur les données plus abondantes d'autres groupes. Cela peut constituer un bon compromis entre l'estimation d'un effet en regroupant complètement tous les groupes, ce qui masque les variations au niveau du groupe, et l'estimation d'un effet pour tous les groupes de manière totalement séparée, ce qui pourrait donner des estimations médiocres pour les groupes peu échantillonnés.
Les effets aléatoires sont simplement l’extension de la technique de la mise en commun partielle en tant que modèle statistique polyvalent. Cela permet d'appliquer l'idée de principe à une grande variété de situations, y compris de multiples prédicteurs, des variables mixtes continues et catégorielles et des structures de corrélation complexes. (Mais avec un grand pouvoir vient une grande responsabilité: la complexité de la modélisation et de l'inférence est considérablement accrue et peut donner lieu à des biais subtils qui nécessitent une sophistication considérable pour être évités.)
Pour motiver le modèle à effets aléatoires, posez-vous la question suivante: pourquoi créeriez-vous un pool partiel? Probablement parce que vous pensez que les petits sous-groupes font partie d'un groupe plus important ayant un effet moyen commun. Les moyennes des sous-groupes peuvent différer un peu des moyennes des grands groupes, mais pas d'un montant arbitraire. Pour formaliser cette idée, nous postulons que les déviations suivent une distribution, typiquement gaussienne. C'est là qu'intervient le "aléatoire" dans les effets aléatoires: nous supposons que les déviations des sous-groupes par rapport à un parent suivent la distribution d'une variable aléatoire. Une fois que vous avez cette idée en tête, les équations du modèle à effets mixtes suivent naturellement.
Malheureusement, les utilisateurs de modèles à effets mixtes ont souvent de fausses idées préconçues sur ce que sont les effets aléatoires et en quoi ils diffèrent des effets fixes. Les gens entendent "aléatoire" et pensent que le système modélisé a une signification particulière: les effets fixes doivent être utilisés lorsque quelque chose est "fixe", tandis que les effets aléatoires doivent être utilisés lorsque quelque chose est "échantillonné au hasard". Mais rien n’est particulièrement aléatoire de supposer que les coefficients du modèle proviennent d’une distribution; il est juste une contrainte douce, semblable à la pénalité appliquée à des coefficients de modèle dans la régression de la crête. Il existe de nombreuses situations dans lesquelles vous pouvez ou ne souhaitez pas utiliser les effets aléatoires, et cela n’a pas nécessairement beaucoup à voir avec la distinction entre "fixe" et "fixe".ℓ2
Malheureusement, la confusion conceptuelle causée par ces termes a conduit à une profusion de définitions contradictoires . Sur les cinq définitions de ce lien, seul le n ° 4 est tout à fait correct dans le cas général, mais il est également totalement dénué d’information. Vous devez lire des articles et des livres entiers (ou, à défaut, cet article) pour comprendre ce que cette définition implique dans le travail pratique.
Exemple
Examinons un cas où la modélisation par effets aléatoires pourrait être utile. Supposons que vous souhaitiez estimer le revenu moyen des ménages américains par code postal. Vous disposez d'un grand ensemble de données contenant des observations sur les revenus des ménages et les codes ZIP. Certains codes postaux sont bien représentés dans l'ensemble de données, mais d'autres ne comptent que quelques ménages.
Pour votre modèle initial, vous prendrez probablement le revenu moyen dans chaque ZIP. Cela fonctionnera bien si vous avez beaucoup de données pour un ZIP, mais les estimations pour vos ZIP mal échantillonnés souffriront d'une variance élevée. Vous pouvez atténuer cela en utilisant un estimateur de retrait (pooling partiel), qui poussera les valeurs extrêmes vers le revenu moyen sur tous les codes ZIP.
Mais combien de retrait / regroupement devriez-vous faire pour un ZIP en particulier? Intuitivement, cela dépend des éléments suivants:
Si vous modélisez le code postal comme un effet aléatoire, l’estimation du revenu moyen dans tous les codes postaux sera soumise à un rétrécissement statistiquement fondé, en tenant compte de tous les facteurs susmentionnés.
La meilleure partie est que les modèles à effets aléatoires et à effets mixtes gèrent automatiquement (4), l’estimation de la variabilité, tous les effets aléatoires du modèle. C'est plus difficile qu'il n'y parait à première vue: vous pouvez essayer la variance de la moyenne de l'échantillon pour chaque ZIP, mais ce sera biaisé, car une partie de la variance entre les estimations pour différentes ZIP n'est que la variance d'échantillonnage. Dans un modèle à effets aléatoires, le processus d'inférence tient compte de la variance d'échantillonnage et réduit l'estimation de la variance en conséquence.
Après avoir pris en compte (1) - (4), un modèle à effets aléatoires / à effets mixtes est en mesure de déterminer le retrait approprié pour les groupes à faible échantillon. Il peut également gérer des modèles beaucoup plus compliqués avec de nombreux prédicteurs différents.
Relation avec la modélisation hiérarchique bayésienne
Si cela vous semble une modélisation bayésienne hiérarchique, vous avez raison, c’est un parent proche mais pas identique. Les modèles à effets mixtes sont hiérarchiques en ce sens qu'ils postulent des distributions pour des paramètres latents non observés, mais ils ne sont généralement pas entièrement bayésiens, car les hyperparamètres de niveau supérieur ne recevront pas de prieurs appropriés. Par exemple, dans l'exemple ci-dessus, nous traiterions probablement le revenu moyen dans une PIZ donnée comme un échantillon d'une distribution normale, avec une moyenne et un sigma inconnus à estimer par le processus d'ajustement à effets mixtes. Cependant, un modèle à effets mixtes (non bayésien) n'aura généralement pas de priorité sur la moyenne inconnue et le sigma, il n'est donc pas totalement bayésien. Cela dit, avec un ensemble de données de taille décente, le modèle à effets mixtes standard et la variante entièrement bayésienne donneront souvent des résultats très similaires.
* Bien que de nombreux traitements de ce sujet se concentrent sur une définition étroite du "groupe", le concept est en réalité très flexible: il ne s'agit que d'un ensemble d'observations partageant une propriété commune. Un groupe peut être composé de plusieurs observations d'une seule personne ou de plusieurs personnes dans une école ou de plusieurs écoles d'un district, ou de plusieurs variétés d'un même type de fruit ou de plusieurs types de légumes de la même récolte ou de plusieurs récoltes. du même genre de légume, etc. Toute variable catégorique peut être utilisée comme variable de regroupement.
la source
J'ai écrit à ce sujet dans un chapitre de livre sur les modèles mixtes (chapitre 13 de Fox, Negrete-Yankelevich et Sosa 2014 ); les pages correspondantes (pp. 311-315) sont disponibles sur Google Books . Je pense que la question se réduit à "quelles sont les définitions des effets fixes et aléatoires?" (Un "modèle mixte" est juste un modèle qui contient les deux). Ma discussion en dit un peu moins sur leur définition formelle (pour laquelle je reviendrais sur l'article de Gelman lié par la réponse de @ JohnSalvatier ci-dessus) et davantage sur leurs propriétés pratiques et leur utilité. Voici quelques extraits:
la source
Effet fixe: quelque chose que l'expérimentateur manipule directement et peut souvent être répété, par exemple, l'administration d'un médicament - un groupe reçoit un médicament, un groupe reçoit un placebo.
Effet aléatoire: Source de variation aléatoire / unités expérimentales, par exemple, individus tirés (au hasard) d'une population pour un essai clinique. Les effets aléatoires estiment la variabilité
Effet mixte: inclut les deux; l’effet fixe dans ces cas est l’estimation des coefficients au niveau de la population, tandis que les effets aléatoires peuvent expliquer les différences individuelles en réponse à un effet, par exemple, chaque personne reçoit à la fois le médicament et le placebo à différentes effect estime l'effet de la drogue, les termes à effets aléatoires permettraient à chaque personne de réagir différemment à la drogue.
Catégories générales d'effets mixtes - mesures répétées, longitudinales, hiérarchiques, en parcelles divisées.
la source
Je suis venu à cette question à partir d' ici , un doublon possible.
Il existe déjà plusieurs excellentes réponses, mais comme indiqué dans la réponse acceptée, il existe de nombreuses utilisations différentes (mais apparentées) du terme. Il pourrait donc être utile de donner la perspective telle qu’elle est utilisée en économétrie, qui ne semble pas encore totalement abordée ici. .
m
Voici le code qui génère les données et qui produit une estimation RE positive et une estimation FE "correcte" et négative. (Cela dit, les estimations de l'ER seront souvent négatives pour les autres semences, voir ci-dessus.)
Le résultat:
la source
La distinction n’a de sens que dans le contexte des statistiques non bayésiennes. Dans les statistiques bayésiennes, tous les paramètres du modèle sont "aléatoires".
la source
En économétrie, les termes sont généralement appliqués dans les modèles linéaires généralisés, où le modèle est de la forme
Dans les modèles linéaires , la présence d'un effet aléatoire n'entraîne pas d'incohérence de l'estimateur MCO. Cependant, l'utilisation d'un estimateur à effets aléatoires (comme les moindres carrés généralisés réalisables) permettra d'obtenir un estimateur plus efficace .
Dans les modèles non linéaires , tels que probit, tobit, ..., la présence d'un effet aléatoire entraînera généralement un estimateur incohérent. L'utilisation d'un estimateur à effets aléatoires rétablira la cohérence.
Pour les modèles linéaires et non linéaires, les effets fixes entraînent un biais. Toutefois, dans les modèles linéaires, certaines transformations peuvent être utilisées (telles que les premières différences ou les dégradations), pour lesquelles les MLS des données transformées donneront lieu à des estimations cohérentes. Pour les modèles non linéaires, il existe quelques exceptions où des transformations existent, par exemple les effets fixes logit .
Exemple: probit à effets aléatoires. Supposer
et le résultat observé est
L’ estimateur du maximum de vraisemblance groupé minimise la moyenne de l’échantillon de
Bien sûr, ici le journal et le produit sont simplifiés, mais pour des raisons pédagogiques, cela rend l’équation plus comparable à l’estimateur à effets aléatoires, qui a la forme suivante:
la source
Ce n'est pas vraiment une définition formelle, mais j'aime bien les diapositives suivantes: Modèles mixtes et pourquoi les sociolinguistes devraient les utiliser ( miroir ), de Daniel Ezra Johnson. Une brève récapitulation est proposée sur la diapositive 4. Bien qu’elle se concentre principalement sur les études psycholinguistiques, elle est très utile dans un premier temps.
la source
Une autre perspective très pratique sur les modèles à effets fixes et aléatoires provient de l'économétrie lorsque vous effectuez des régressions linéaires sur des données de panel . Si vous estimez le lien entre une variable explicative et une variable de résultat dans un jeu de données comportant plusieurs échantillons par individu / groupe, vous utiliserez ce cadre.
Un bon exemple de données de panel est constitué par les mesures annuelles d'un groupe d'individus de:
Si nous essayons de comprendre la relation entre l'exercice et le changement de poids, nous allons configurer la régression suivante:
La question clé est donc de déterminer quel modèle est approprié. La réponse est le test Hausman . Pour l'utiliser, nous effectuons la régression des effets fixes et aléatoires, puis appliquons le test de Hausman pour voir si leurs estimations de coefficients divergent de manière significative. S'ils divergent, l'endogénéité est en jeu et un modèle à effets fixes est le meilleur choix. Sinon, nous allons aller avec des effets aléatoires.
la source