J'essaie d'élargir mes connaissances en statistiques. Je viens d'un milieu de sciences physiques avec une approche de test statistique "basée sur des recettes", où nous disons que le test est continu, qu'il est distribué normalement - régression MLS .
Dans ma lecture, j'ai rencontré les termes: modèle à effets aléatoires, modèle à effets fixes, modèle marginal. Mes questions sont:
- En termes très simples, quels sont-ils?
- Quelles sont les différences entre eux?
- Certains d'entre eux sont-ils synonymes?
- Où se situent les tests traditionnels tels que la régression OLS, l'ANOVA et l'ANCOVA dans cette classification?
J'essaie juste de décider où aller avec l'auto-étude.
Réponses:
Cette question a été partiellement discutée sur ce site comme ci-dessous, et les opinions semblent mitigées.
Tous les termes sont généralement liés à des données longitudinales / panel / cluster / hiérarchique et à des mesures répétées (dans le format de régression avancée et ANOVA), mais ont plusieurs significations dans un contexte différent. Je voudrais répondre à la question dans des formules basées sur mes connaissances.
Modèle à effets fixes
Modèle à effets aléatoires
Modèle marginal
Le modèle marginal est généralement comparé au modèle conditionnel (modèle à effets aléatoires) et le premier se concentre sur la moyenne de la population (prenons un modèle linéaire par exemple). tandis que ce dernier traite de la moyenne conditionnelleL'interprétation et l'échelle des coefficients de régression entre modèle marginal et modèle à effets aléatoires seraient différentes pour les modèles non linéaires (par exemple, la régression logistique). Soit , puis
la source
Corrigez-moi si je me trompe ici:
Conceptuellement, il y a quatre effets possibles: interception fixe, coefficient fixe, interception aléatoire, coefficient aléatoire. La plupart des modèles de régression sont des «effets aléatoires», ils ont donc des interceptions et des coefficients aléatoires. Le terme «effet aléatoire» est entré en usage par opposition à «effet fixe».
On appelle «effet fixe» lorsqu'une variable affecte une partie de l'échantillon, mais pas la totalité. La version la plus simple d'un modèle à effet fixe (conceptuellement) serait une variable factice, pour un effet fixe avec une valeur binaire. Ces modèles ont une interception aléatoire unique, des coefficients à effets fixes et des coefficients de variables aléatoires.
Le niveau suivant de complication (conceptuellement) est celui où l'effet fixe n'est pas binaire, mais nominal, avec de nombreuses valeurs. Dans ce cas, ce qui est généré est un modèle avec de nombreuses intersections (une pour chacune des valeurs nominales). Vous obtenez ici les "lignes multiples" classiques d'un modèle de données de panel , dans lesquelles chacune des "options" d'une variable à effet fixe obtient son propre effet. L'avantage de regrouper toutes les séries de données spécifiques à un facteur dans une seule régression (plutôt que de traiter chaque facteur de l'effet fixe comme sa propre régression) est que vous pouvez regrouper la variance de tous les effets différents dans une équation, et ainsi de suite. obtenir de meilleures valeurs (plus certaines) pour tous vos coefficients.
Le «troisième niveau» de complication serait le cas où «l'effet fixe» est lui-même une variable aléatoire, sauf que ses effets sont «fixés» pour n'affecter qu'un sous-ensemble de l'échantillon. A ce stade, le modèle aurait une interception aléatoire, plusieurs interceptions fixes et plusieurs variables aléatoires. Je pense que c'est ce qu'on appelle un modèle à «effets mixtes»?
Les modèles à «effets mixtes» sont utilisés pour la modélisation à plusieurs niveaux (MLM), car les «effets fixes» peuvent être utilisés pour imbriquer un sous-ensemble de données dans un autre. Ce groupe peut avoir plusieurs niveaux, avec des étudiants imbriqués dans des salles de classe, imbriqués dans des écoles. L'école est un effet fixe sur les salles de classe et les salles de classe sur les élèves. (L'école peut être ou ne pas être un effet fixe sur l'élève, en fonction de la conception expérimentale - pas sûr)
Les modèles de données de panel sont des modèles «à effets mixtes», mais utilisent deux dimensions pour le regroupement, généralement le temps et une sorte de catégorie.
la source