Je me demande quelles sont les différences entre les GLM mixtes et non mélangées. Par exemple, dans SPSS, le menu déroulant permet aux utilisateurs d’inscrire:
analyze-> generalized linear models-> generalized linear models
Etanalyze-> mixed models-> generalized linear
Traitent-ils différemment les valeurs manquantes?
Ma variable dépendante est binaire et j'ai plusieurs variables indépendantes catégorielles et continues.
mixed-model
generalized-linear-model
glmm
gee
utilisateur9203
la source
la source
Réponses:
L'avènement des modèles linéaires généralisés nous a permis de construire des modèles de données de type régression lorsque la distribution de la variable de réponse est non normale, par exemple lorsque votre DV est binaire. (Si vous souhaitez en savoir un peu plus sur GLiMs, j’ai écrit ici une réponse assez détaillée , qui peut être utile bien que le contexte soit différent.) Cependant, un GLiM, par exemple un modèle de régression logistique, suppose que vos données sont indépendantes . Par exemple, imaginons une étude qui examine si un enfant a développé un asthme. Chaque enfant contribue unpoint de données à l'étude - ils ont l'asthme ou ils n'ont pas. Parfois, les données ne sont pas indépendantes, cependant. Prenons une autre étude qui examine si un enfant est enrhumé à différents moments de l’année scolaire. Dans ce cas, chaque enfant contribue de nombreux points de données. À un moment donné, un enfant pourrait attraper un rhume, plus tard, il se pourrait que non, et encore plus tard, il se peut qu'un autre soit enrhumé. Ces données ne sont pas indépendantes car elles proviennent du même enfant. Pour analyser correctement ces données, nous devons en quelque sorte prendre en compte cette non-indépendance. Il y a deux façons: l'une consiste à utiliser les équations d'estimation généralisées (que vous ne mentionnez pas, nous allons donc sauter). L’autre méthode consiste à utiliser un modèle mixte linéaire généralisé. Les GLiMM peuvent expliquer cette non-indépendance en ajoutant des effets aléatoires (comme le note @ MichaelChernick). Par conséquent, la réponse est que votre deuxième option concerne des données de mesures répétées non normales (ou sinon des données non indépendantes). (Je dois mentionner, conformément au commentaire de @ Macro, que les modèles mixtes linéaires généralisés incluent les modèles linéaires en tant que cas particulier et peuvent donc être utilisés avec des données distribuées normalement. Cependant, le terme désigne généralement des données non normales.)
Mise à jour: (Le PO a également posé une question sur GEE. J'écrirai donc un peu sur la relation entre les trois.)
Voici un aperçu de base:
Étant donné que vous avez plusieurs essais par participant, vos données ne sont pas indépendantes. comme vous le constatez à juste titre, "[l] es comparaisons au sein d'un participant risquent d'être plus similaires que par rapport à l'ensemble du groupe". Par conséquent, vous devez utiliser un GLMM ou le GEE.
La question, alors, est de savoir comment choisir si GLMM ou GEE conviendrait mieux à votre situation. La réponse à cette question dépend du sujet de votre recherche - en particulier de la cible des inférences que vous souhaitez faire. Comme je l'ai indiqué ci-dessus, avec un GLMM, les bêtas vous expliquent l'effet d'un changement d'une unité de vos covariables sur un participant particulier, compte tenu de leurs caractéristiques individuelles. En revanche, avec le GEE, les bêtas vous expliquent l’effet d’un changement d’une unité dans vos covariables sur la moyenne des réponses de toute la population en question. Il est difficile de saisir cette distinction, en particulier parce qu’il n’existe aucune distinction de ce type avec les modèles linéaires (dans ce cas, les deux sont la même chose).
La question de savoir si vous devez utiliser un GLMM ou le GEE est la question de savoir laquelle de ces fonctions vous souhaitez estimer. Si vous vouliez savoir sur la probabilité d'un décès étudiant donné (si, par exemple, vous étiez l'étudiant ou le parent de l'étudiant), vous souhaitez utiliser un GLMM. D'autre part, si vous voulez connaître l'effet sur la population (si, par exemple, vous étiez l' enseignant ou le principal), vous voudriez utiliser le GEE.
Pour une autre discussion de ce matériau, plus détaillée sur le plan mathématique, voir cette réponse de @Macro.
la source
La clé est l'introduction d'effets aléatoires. Le lien de Gung le mentionne. Mais je pense que cela aurait dû être mentionné directement. C'est la principale différence.
la source
Je vous suggère également d'examiner les réponses à une question que j'ai posée il y a quelque temps:
Modèle linéaire général et modèle linéaire généralisé (avec une fonction de lien d'identité?)
la source