Les effets aléatoires peuvent-ils s'appliquer uniquement aux variables catégorielles?

9

Cette question peut sembler stupide, mais ... est-il exact que les effets aléatoires ne peuvent s'appliquer qu'aux variables catégorielles (comme l'identifiant individuel, l'identifiant de la population, ...), par exemple, disons que est une variable catégorielle:xi

yi ~βxi

βxi ~Norm(μ,δ2)

mais d'après le principe, l' effet aléatoire ne peut pas s'appliquer à une variable continue (comme la hauteur, la masse ...), disons :zi

yi ~α+βzi

car alors il n'y a qu'un seul coefficient qui ne peut pas être contraint? Cela semble logique mais je me demande pourquoi il n'est jamais mentionné dans la littérature statistique! Merci!β

EDIT: Mais que se passe-t-il si je contrains comme ~ ? S'agit-il alors d'un effet aléatoire? Mais ceci est différent de la contrainte que je mets sur - ici je contrains la variable alors que dans l'exemple précédent j'ai contraint le coefficient ! Cela commence à me sembler un gros gâchis ... Quoi qu'il en soit, cela n'a pas beaucoup de sens de mettre cette contrainte, car sont des valeurs connues, alors peut-être que cette idée est complètement étrange :-)ziziNorm(μ,δ2)βxizi

Curieuse
la source
1
Question connexe intéressante: stats.stackexchange.com/q/61531/5509
Curieux

Réponses:

5

C'est une bonne et très simple question.

L'interprétation des effets aléatoires est très spécifique au domaine et dépend du choix de modélisation (le modèle statistique ou le fait d'être bayésien ou fréquentiste). Pour une très bonne discussion, voir page 245, Gelman et Hill (2007) . Pour un bayésien, tout est aléatoire (même si les paramètres peuvent avoir une vraie valeur fixe, ils sont modélisés comme aléatoires), et un fréquentiste peut également choisir une valeur de paramètre comme un effet fixe qui aurait autrement été modélisé comme aléatoire (voir Casella, 2008 , discussion sur les blocs devant être fixes ou aléatoires dans l'exemple 3.2).

Modifier (après commentaire)

Les données sont fixées après les avoir observées. S'ils sont continus, ils doivent être modélisés comme continus. Vous pouvez modéliser des variables catégorielles comme catégoriques et parfois comme continues (comme dans un paramètre de variable ordinale). Les paramètres sont inconnus et ils peuvent être modélisés comme fixes ou aléatoires. Les paramètres concernent essentiellement la réponse aux prédicteurs. Si vous souhaitez que la pente d'un prédicteur individuel (ou son coefficient dans un modèle linéaire) varie pour chaque réponse, modélisez-la comme aléatoire, sinon modélisez-la comme fixe. De même, si vous souhaitez que l'interception varie en fonction des groupes, ils doivent être modélisés comme aléatoires; sinon, ils devraient être corrigés.

suncoolsu
la source
1
Merci pour votre réponse, mais hmmm .... J'ai posé une question simple et je m'attendais en quelque sorte à une réponse simple ou générale :) Dans votre 2ème paragraphe, vous dites qu'en bayésien, tout est aléatoire. Veuillez ne pas trop compliquer :) J'ai posé intentionnellement au niveau du modèle, veuillez oublier fréquentiste ou bayésien - je suis intéressé par le principe - pour quel type de variables les effets aléatoires sont généralement utilisés?
Curieux
Dans le 3ème paragraphe il vous met une application spéciale avec des séries temporelles, je ne suis pas sûr de bien le comprendre mais les séries temporelles AFAIK sont généralement discrètes (pas continues) si vous parlez de corrélation sérielle ... Bref, si vous avez en quelque sorte plus général répondez, veuillez partager. Encore une fois, merci pour la réponse!
Curieux
Le hasard est dans des choses inconnues. Quand vous avez des observations, elles sont connues! La seule chose que vous connaissez, ce sont vos données. Les inconnues sont les paramètres et elles peuvent être modélisées comme aléatoires ou fixes. (désolé pour la confusion; je suis d'accord, j'ai compliqué inutilement les choses.)
suncoolsu
merci d'avoir simplifié votre réponse. Venant donc à la racine de ma question - cela signifie que la réponse est oui , c'est-à-dire que les effets aléatoires ne s'appliquent qu'aux variables catégorielles, car les effets aléatoires ne s'appliquent qu'aux paramètres (pas aux données), et aux seuls paramètres qui peuvent être modélisés sont aussi aléatoires ceux à plusieurs niveaux, c'est-à-dire ceux d'une variable catégorielle? Et les paramètres des variables continues ne peuvent pas être modélisés comme aléatoires, car il n'y a qu'une seule valeur de paramètre pour la variable continue? Merci!
Curieux
Dans votre contexte spécifique, la réponse est OUI . Mais en général, la réponse, je dirais, est NON car les variables continues peuvent varier selon les groupes. Par exemple, le revenu des résidents de la ville devrait être supérieur à celui du village (selon vous, cela pourrait être deux variables catégorielles distinctes pour l'emplacement).
suncoolsu
3

Votre question a peut-être déjà été résolue, mais elle est en fait écrite dans un manuel;

Les effets aléatoires sont des variables catégorielles dont les niveaux sont considérés comme un échantillon d'une population plus large, contrairement aux effets fixes, dont les niveaux présentent un intérêt en soi,

à la page 232 de: Alan Grafen et Rosie Hails (2002) "Modern statistics for the life sciences", Oxford University Press.

sapporo
la source
2
Tout cela est vrai, mais je ne pense pas que cela réponde à la question.
Patrick Coulombe
1
Je ne suis pas d'accord avec le commentaire ci-dessus de @PatrickCoulombe, je pense que cela répond précisément à la question. +1.
amibe
1

Je pense que le problème est qu'il y a deux choses en jeu ici. Un exemple typique d'effets aléatoires pourrait être de prédire la moyenne pondérée cumulative (GPA) d'un étudiant en fonction d'un certain nombre de facteurs, y compris leur score moyen dans une série de tests au secondaire.

Le score moyen est continu . Vous auriez généralement une interception variable, ou interception et pente, pour le score moyen pour chaque individu. L'individu est évidemment catégorique .

Donc, quand vous dites "ne s'applique qu'aux variables catégorielles", c'est un peu vague. Supposons que vous envisagiez uniquement une interception aléatoire pour le score moyen. Dans ce cas, votre interception aléatoire pour une quantité continue et en fait est probablement modélisée comme quelque chose comme une variable gaussienne avec une moyenne et un écart-type à déterminer par la procédure. Mais cette interception aléatoire est déterminée sur une population d'élèves où chaque élève est identifié par une variable catégorielle.

Vous pouvez utiliser une variable "continue" au lieu de la carte d'étudiant. Vous pourriez peut-être choisir la taille d'un élève. Mais il faudrait essentiellement le traiter comme s'il était catégorique. Si vos mesures de hauteur étaient très précises, vous vous retrouveriez à nouveau avec une hauteur unique pour chaque élève, donc vous n'auriez rien fait de différent. Si vos mesures de hauteur n'étaient pas très précises, vous finiriez par regrouper plusieurs élèves à chaque hauteur. (Mélanger leurs scores d'une manière peut-être mal définie.)

C'est en quelque sorte l'opposé des interactions. Dans une interaction, vous multipliez deux variables et les traitez essentiellement comme continues. Une variable catégorielle serait divisée en un ensemble de variables fictives 0/1 et le 0 ou 1 serait multiplié par l'autre variable dans l'interaction.

L'essentiel, c'est qu'un "effet aléatoire" n'est en quelque sorte qu'un coefficient qui a une distribution (est modélisée) plutôt qu'une valeur fixe.

Wayne
la source
Veuillez vous connecter sous votre compte principal pour pouvoir modifier.
amibe