La distinction entre les variables strictement aléatoires (qui devraient être modélisées en tant que telles) et les variables non aléatoires qui, selon certains, pourraient être modélisées comme aléatoires s'il s'agit d'un modèle hiérarchique / à plusieurs niveaux, est floue pour moi.
Bates et Bolker illustrent les effets aléatoires avec des cas de vrais aléas, par exemple la qualité des produits dans des échantillons sélectionnés au hasard. Bien que leur lme4
travail soit incroyable, il est encore peu clair où la ligne entre aléatoire et non aléatoire. Les discussions en sciences sociales rendent cela encore plus flou. Les modèles multiniveaux / hiérarchiques et les modèles à effets aléatoires sont calculativement égaux lme4
, alors où tracer la ligne?
Par exemple, j'ai un ensemble de données avec des mesures répétées sur plusieurs individus (c'est aléatoire!) Mais je crois, et les résultats de lme4
montrer, qu'une grande proportion de la variance réside dans leurs variables socio-économiques (telles que la zone de vie, la race, etc.). Ces variables ne sont pas aléatoires, mais les modèles à plusieurs niveaux font valoir qu'elles pourraient être utilisées en tant que telles. D'autres exemples proviennent d'études sur les notes des élèves, emboîtant généralement les élèves au sein des enseignants et plus loin au sein des écoles. Toutes ces variables sont constantes.
Peut-on modéliser des facteurs non aléatoires comme aléatoires si cela est plausible dans le domaine des modèles (hiérarchiques) à plusieurs niveaux?
la source
Réponses:
Je suis perplexe devant votre question. Je sais que vous dites que vous comprenez les effets fixes et les effets aléatoires, mais peut-être que vous ne les comprenez pas de la même manière que moi. J'ai posté un extrait plutôt étendu d'un sous presse chapitre de livre ici ce qui explique mon avis (plutôt pragmatique, assez aligné en étroite collaboration avec Andrew Gelman).
Répondre plus directement à la question:
Cela peut ajouter de la clarté pour distinguer les variables de regroupement (qui doivent être catégoriques), qui représentent les groupes à travers lesquels les choses varient et les effets , qui sont les différences de certains paramètres / effets (généralement l'ordonnée à l'origine, mais pourraient être les effets du revenu / éducation / autre) à tous les niveaux de certaines variables de regroupement.
mise à jour : je me permettrai de donner un contrepoint à votre
Je ne sais pas ce que cela signifie. Vous savez de quel quartier provient chaque observation, non? Comment est-ce "inobservé"? (Si vous soupçonniez le regroupement de vos données sur la base de facteurs non observés , vous devez adapter un modèle de mélange discret .) Si vous voulez dire que vous ne savez pas pourquoi les quartiers sont différents, je ne pense pas que cela importe ici.
La seule raison pour laquelle je peux penser à ne pas utiliser le quartier comme effet aléatoire serait si vous n'aviez mesuré qu'un petit nombre (disons <6) de quartiers.
la source