Que faire de l'hétérogénéité de la variance lorsque l'écart diminue avec des valeurs ajustées plus grandes

9

J'essaie de produire un modèle mixte linéaire, le code R est le suivant.

lme (Average.payoff ~ Game + Type + Others.Type + Game: Type + Game: Others.Type + Type: Others.Type, random = ~ 1 | Subjects, method = "REML", data = Subjectsm1) -> lme1

Le terme de réponse Average.payoff est continu tandis que toutes les variables explicatives sont toutes binaires.

Quand j'arrive à la validation, je peux clairement voir que la dispersion des résidus diminue avec des valeurs ajustées plus grandes. Bien qu'il semble y avoir beaucoup d'informations sur l'hétérogénéité sous la forme où les résidus augmentent avec des valeurs ajustées plus grandes, je n'ai rien lu sur des cas similaires au mien.

J'ai tracé les résidus par rapport à chaque effet explicatif et je peux voir que l'écart diminue avec des valeurs ajustées plus grandes pour les variables Game et Type mais augmente pour la variable Others.Type.

Quelle en est la cause et que dois-je faire?

Dois-je envisager d'ajouter des termes quadratiques ou d'utiliser une modélisation additive? Y a-t-il une transformation à appliquer?

Merci,

Jonathan

Jonathan Bone
la source

Réponses:

1

L'ajout de termes quadratiques aiderait si la moyenne variait de cette façon, mais la variabilité est dans la variance dans votre cas. Étant donné que ce sont les covariables qui provoquent le changement, une forme d'estimation de la fonction de variance impliquant ces covariables serait l'approche que je recommande.

Michael R. Chernick
la source
1
Salut @Michael - Pouvez-vous donner plus de détails ici? Certains ne savent peut-être pas comment incorporer une forme fonctionnelle pour la variance d'erreur dans un modèle de régression. Aviez-vous quelque chose de spécifique en tête?
Macro
@Macro Je pense aux modèles qui fournissent conjointement des équations pour l'espérance conditionnelle et la variance conditionnelle de la variable de réponse Y étant donné les covariables. Ces modèles sont discutés dans Wayne Fuller "Measurement Error Models" et dans Carroll et al "Measurement Error in Nonlinear Models: A Modern Perspective". L'idée est d'exprimer la composante d'erreur du modèle comme ayant une variance qui est σ2multiplié par une fonction non négative g des covariables du modèle.
Michael R. Chernick
1
Voir Carroll et al. pp. 79 à 85 et Fuller .
Michael R. Chernick