Pièges des modèles mixtes linéaires

18

Quels sont les principaux pièges de l'utilisation de modèles linéaires à effets mixtes? Quelles sont les choses les plus importantes à tester / surveiller lors de l'évaluation de la pertinence de votre modèle? Lorsque vous comparez des modèles du même ensemble de données, quelles sont les choses les plus importantes à rechercher?

Alan H.
la source

Réponses:

16

C'est une bonne question.

Voici quelques pièges courants:

  1. En utilisant la théorie de la vraisemblance standard, nous pouvons dériver un test pour comparer deux hypothèses imbriquées, et , en calculant la statistique du test du rapport de vraisemblance. La distribution nulle de cette statistique de test est approximativement khi carré avec des degrés de liberté égaux à la différence des dimensions des deux espaces de paramètres. Malheureusement, ce test n'est qu'approximatif et nécessite plusieurs hypothèses. Une hypothèse cruciale est que les paramètres sous le zéro ne sont pas à la limite de l'espace des paramètres. Puisque nous sommes souvent intéressés à tester des hypothèses sur les effets aléatoires qui prennent la forme: Ceci est une réelle préoccupation.H0H1

    H0:σ2=0
    La façon de contourner ce problème consiste à utiliser REML. Mais encore, les valeurs de p auront tendance à être plus grandes qu'elles ne devraient l'être. Cela signifie que si vous observez un effet significatif en utilisant l'approximation χ2, vous pouvez être assez sûr qu'il est réellement significatif. Des valeurs de p faibles, mais non significatives, pourraient inciter à utiliser des méthodes de bootstrap plus précises, mais chronophages.
  2. Comparaison des effets fixes: si vous prévoyez d'utiliser le test du rapport de vraisemblance pour comparer deux modèles imbriqués qui ne diffèrent que par leurs effets fixes, vous ne pouvez pas utiliser la méthode d'estimation REML. La raison en est que REML estime les effets aléatoires en considérant des combinaisons linéaires des données qui suppriment les effets fixes. Si ces effets fixes sont modifiés, les probabilités des deux modèles ne seront pas directement comparables.

  3. Valeurs P: Les valeurs p générées par le test du rapport de vraisemblance pour les effets fixes sont approximatives et malheureusement ont tendance à être trop petites, surestimant ainsi parfois l'importance de certains effets. Nous pouvons utiliser des méthodes de bootstrap non paramétriques pour trouver des valeurs de p plus précises pour le test du rapport de vraisemblance.

  4. Il y a d'autres préoccupations concernant les valeurs de p pour le test des effets fixes qui sont mises en évidence par le Dr Doug Bates [ ici ].

Je suis sûr que les autres membres du forum auront de meilleures réponses.

Source: Extension des modèles linéaires avec R - Dr. Julain Faraway.

suncoolsu
la source
9

Le piège commun que je vois est l'ignorance de la variance des effets aléatoires. S'il est important par rapport à la variance résiduelle ou à la variance de la variable dépendante, l'ajustement semble généralement agréable, mais uniquement parce que les effets aléatoires expliquent toute la variance. Mais comme le graphique des résultats réels par rapport aux prévisions est agréable, vous avez tendance à penser que votre modèle est bon.

Tout s'effondre lorsqu'un tel modèle est utilisé pour prédire de nouvelles données. Habituellement, vous ne pouvez utiliser que des effets fixes et l'ajustement peut être très médiocre.

mpiktas
la source
6

La modélisation de la structure de variance est sans doute la caractéristique unique la plus puissante et la plus importante des modèles mixtes. Cela va au-delà de la structure de variance pour inclure la corrélation entre les observations. Il faut prendre soin de construire une structure de covariance appropriée, sinon les tests d'hypothèses, les intervalles de confiance et les estimations des moyens de traitement pourraient ne pas être valides. Souvent, il faut connaître l'expérience pour spécifier les effets aléatoires corrects.

SAS pour les modèles mixtes est ma ressource, même si je veux faire l'analyse en R.

Glen
la source