Comprendre l'effet d'un facteur aléatoire continu dans un modèle à effets mixtes

10

Je comprends l'effet d'un effet aléatoire catégorique sur un modèle à effets mixtes en ce qu'il effectue un regroupement partiel des observations par niveau dans l'effet aléatoire, en supposant effectivement que les observations ne sont pas indépendantes elles-mêmes, mais seulement leurs pools partiels. À ma connaissance également, dans un tel modèle, les observations partageant le même niveau d'effet aléatoire mais différant dans leur niveau d'effet fixe l'emporteront sur les observations différant à la fois dans leur niveau d'effet aléatoire et d'effet fixe.

Quel est alors l'effet d'un facteur aléatoire continu? Étant donné qu'un modèle sans effet aléatoire a montré que l'effet fixe avait une taille d'effet X. Dois-je m'attendre à ce que si les observations aux différents niveaux de l'effet fixe provenaient des extrémités du continuum de l'effet aléatoire, la taille de l'effet deviendra plus petite dans un modèle qui incluait le facteur aléatoire, alors que si les observations à différents niveaux de facteurs fixes avaient des valeurs d'effet aléatoire similaires, la taille de l'effet augmenterait?

Roey Angel
la source
1
Pouvez-vous fournir les formules et / ou le code R / Stata pour illustrer votre réflexion? Vous utilisez un langage quelque peu inhabituel ... du moins inhabituel pour moi. Je pense que votre "facteur aléatoire continu" est ce que j'appellerais "pente aléatoire", mais je voulais d'abord vérifier.
StasK
@StasK En termes de R: si le facteur aléatoire est catégorique (facteur dans R) alors les observations sont partiellement regroupées, c'est-à-dire que les moyennes de groupe (niveaux de facteurs aléatoires) sont des moyennes pondérées de la moyenne de la population et les moyennes de groupe non regroupées avec des poids proportionnels à la taille de l'échantillon et à l'inverse de la variance. Ma question est de savoir ce qui se fait lorsque le facteur aléatoire est continu (numérique en termes de R). Comment cela affecte-t-il le modèle?
Roey Angel
1
@RoeyAngel: cela ne l'affecte probablement pas de manière sensée. Spécifiquement pour R's, lmerpar exemple, un modèle où l'effet aléatoire a une valeur distincte pour chaque point de données ne parviendra même pas à calculer. Pensez-y en termes purement conceptuels: si votre matrice est carrée, votre vecteur contenant la réalisation des effets aléatoires sera de taille ( : # de points d'échantillonnage) et vous aurez donc une structure d'erreur non identifiable. Êtes-vous sûr de poser cette question? En tant que StasK, j'ai également du mal à suivre votre question. ZγNN
usεr11852
@ user11852 hmmm Honnêtement, je ne l'ai jamais essayé moi-même avec un effet aléatoire où chaque point a une valeur unique. Donc, ce que vous dites essentiellement, c'est qu'un effet aléatoire est toujours traité comme un facteur catégoriel (c'est-à-dire qu'il n'y a pas de parallèle avec la façon dont les vars continus sont traités dans une ANCOVA par exemple).
Roey Angel
@RoeyAngle: Je ne connais pas spécifiquement ANCOVA, mais certainement ce que j'ai dit à propos des stands de non-identifiabilité. Vous ne pouvez pas estimer si le est égal à la taille de vos données. Il a été traité comme catégorique car reflète une structure (c.-à-d. Catégorisation) des données elles-mêmes (par exemple, lot, groupe, emplacement, etc.). Pensez-y dans le contexte des modèles hiérarchiques (un sous-ensemble de modèles mixtes): si une hiérarchie définissait à un certain niveau autant de descendants que de points de données, elle serait redondante. γγZ
usεr11852

Réponses:

1

J'ai dû réfléchir sérieusement à ce que vous demandiez. Au début, je pensais comme @ user11852, que vous vouliez que chaque observation ait son propre effet aléatoire unique. Cela rendrait le modèle désespérément non identifié, car il n'y aurait aucun moyen concevable de distinguer la variation de l'effet aléatoire de l'erreur du modèle.

Mais je crois que dans la portée de votre question, tous les effets aléatoires sont en fait continus et probablement normalement distribués. Cependant, votre allusion à "catégorique" n'est pas hors du mur, car la matrice de conception pour une interception aléatoire (généralement appelée Z) ressemblerait à une matrice de conception pour une variable catégorielle.

Ajoutons un peu de concret et disons que le prédicteur linéaire est où et sont les effets fixes et et sont les effets aléatoires spécifiques à l' . Je pense que par "continu", vous voulez dire un effet aléatoire comme plutôt que . Notez que les deux sont toujours constants au sein d'un sujet .

(α¯+αi)+(β¯+βi)xij,
α¯β¯αiβiiβiαii

Maintenant, réfléchissons à la situation que vous proposez:

différents niveaux de l'effet fixe provenaient des extrémités du continuum à effets aléatoires

Si nous considérons que est l'effet fixe, alors il ne pourrait pas avoir différents niveaux, mais pourrait. Supposons que pour les petites valeurs de , la pente est plus petite; est négatif pour les sujets avec des valeurs généralement faibles de . Or par construction, les extrêmes de correspondent aux extrêmes de .β¯xijxijβiixijxijβi

Cela nous laisse avec ce qui se passe avec vs sans l'effet aléatoire. Mes pensées sont, s'il n'y avait que quelques cas extrêmes de la situation ci-dessus, l'ajout d'un effet aléatoire aurait tendance à tirer l'estimation de vers le haut. Mais je ne suis pas totalement sûr. Dans la modélisation linéaire mixte traditionnelle, les estimations des effets fixes ne sont en réalité que des estimations des moindres carrés pondérés. Bien que ces poids soient directement liés à la distribution des effets aléatoires, leur impact diminuera à mesure que la taille de votre échantillon augmentera. Dans un cadre réaliste avec des tailles d'échantillons même modérées, je ne m'attendrais pas à ce que quelque chose de trop extrême arrive à vos estimations d'effet fixe lorsque vous ajoutez un effet aléatoire.β

Ben Ogorek
la source