Cette question peut sembler stupide, mais ... est-il exact que les effets aléatoires ne peuvent s'appliquer qu'aux variables catégorielles (comme l'identifiant individuel, l'identifiant de la population, ...), par exemple, disons que est une variable catégorielle:
~
~
mais d'après le principe, l' effet aléatoire ne peut pas s'appliquer à une variable continue (comme la hauteur, la masse ...), disons :
~
car alors il n'y a qu'un seul coefficient qui ne peut pas être contraint? Cela semble logique mais je me demande pourquoi il n'est jamais mentionné dans la littérature statistique! Merci!
EDIT: Mais que se passe-t-il si je contrains comme ~ ? S'agit-il alors d'un effet aléatoire? Mais ceci est différent de la contrainte que je mets sur - ici je contrains la variable alors que dans l'exemple précédent j'ai contraint le coefficient ! Cela commence à me sembler un gros gâchis ... Quoi qu'il en soit, cela n'a pas beaucoup de sens de mettre cette contrainte, car sont des valeurs connues, alors peut-être que cette idée est complètement étrange :-)
Réponses:
C'est une bonne et très simple question.
L'interprétation des effets aléatoires est très spécifique au domaine et dépend du choix de modélisation (le modèle statistique ou le fait d'être bayésien ou fréquentiste). Pour une très bonne discussion, voir page 245, Gelman et Hill (2007) . Pour un bayésien, tout est aléatoire (même si les paramètres peuvent avoir une vraie valeur fixe, ils sont modélisés comme aléatoires), et un fréquentiste peut également choisir une valeur de paramètre comme un effet fixe qui aurait autrement été modélisé comme aléatoire (voir Casella, 2008 , discussion sur les blocs devant être fixes ou aléatoires dans l'exemple 3.2).
Modifier (après commentaire)
Les données sont fixées après les avoir observées. S'ils sont continus, ils doivent être modélisés comme continus. Vous pouvez modéliser des variables catégorielles comme catégoriques et parfois comme continues (comme dans un paramètre de variable ordinale). Les paramètres sont inconnus et ils peuvent être modélisés comme fixes ou aléatoires. Les paramètres concernent essentiellement la réponse aux prédicteurs. Si vous souhaitez que la pente d'un prédicteur individuel (ou son coefficient dans un modèle linéaire) varie pour chaque réponse, modélisez-la comme aléatoire, sinon modélisez-la comme fixe. De même, si vous souhaitez que l'interception varie en fonction des groupes, ils doivent être modélisés comme aléatoires; sinon, ils devraient être corrigés.
la source
Votre question a peut-être déjà été résolue, mais elle est en fait écrite dans un manuel;
à la page 232 de: Alan Grafen et Rosie Hails (2002) "Modern statistics for the life sciences", Oxford University Press.
la source
Je pense que le problème est qu'il y a deux choses en jeu ici. Un exemple typique d'effets aléatoires pourrait être de prédire la moyenne pondérée cumulative (GPA) d'un étudiant en fonction d'un certain nombre de facteurs, y compris leur score moyen dans une série de tests au secondaire.
Le score moyen est continu . Vous auriez généralement une interception variable, ou interception et pente, pour le score moyen pour chaque individu. L'individu est évidemment catégorique .
Donc, quand vous dites "ne s'applique qu'aux variables catégorielles", c'est un peu vague. Supposons que vous envisagiez uniquement une interception aléatoire pour le score moyen. Dans ce cas, votre interception aléatoire pour une quantité continue et en fait est probablement modélisée comme quelque chose comme une variable gaussienne avec une moyenne et un écart-type à déterminer par la procédure. Mais cette interception aléatoire est déterminée sur une population d'élèves où chaque élève est identifié par une variable catégorielle.
Vous pouvez utiliser une variable "continue" au lieu de la carte d'étudiant. Vous pourriez peut-être choisir la taille d'un élève. Mais il faudrait essentiellement le traiter comme s'il était catégorique. Si vos mesures de hauteur étaient très précises, vous vous retrouveriez à nouveau avec une hauteur unique pour chaque élève, donc vous n'auriez rien fait de différent. Si vos mesures de hauteur n'étaient pas très précises, vous finiriez par regrouper plusieurs élèves à chaque hauteur. (Mélanger leurs scores d'une manière peut-être mal définie.)
C'est en quelque sorte l'opposé des interactions. Dans une interaction, vous multipliez deux variables et les traitez essentiellement comme continues. Une variable catégorielle serait divisée en un ensemble de variables fictives 0/1 et le 0 ou 1 serait multiplié par l'autre variable dans l'interaction.
L'essentiel, c'est qu'un "effet aléatoire" n'est en quelque sorte qu'un coefficient qui a une distribution (est modélisée) plutôt qu'une valeur fixe.
la source