Comment puis-je évaluer l'ajustement GEE / modèle logistique lorsque les covariables ont des données manquantes?

9

J'ai ajusté deux modèles d'équations d'estimation généralisées (GEE) à mes données:

1) Modèle 1: le résultat est une variable longitudinale Oui / Non (A) (année 1,2,3,4,5) avec prédicteur continu longitudinal (B) pour les années 1,2,3,4,5.

2) Modèle 2: Le résultat est la même variable longitudinale Oui / Non (A), mais maintenant avec mon prédicteur fixé à sa valeur de l'année 1, c'est-à-dire forcé d'être invariant dans le temps (B).

En raison de mesures manquantes dans mon prédicteur longitudinal à quelques moments dans différents cas, le nombre de points de données dans le modèle 2 est plus élevé que dans le modèle 1.

Je voudrais savoir quelles comparaisons je peux valablement faire entre les rapports de cotes, les valeurs de p et l'ajustement des deux modèles, par exemple:

  • Si l'OR pour le prédicteur B est plus grand dans le modèle 1, puis-je valablement dire que l'association entre A et B est plus forte dans le modèle 1?

  • Comment puis-je évaluer quel est le meilleur modèle pour mes données. ai-je raison de penser que les pseudo-carrés QIC / AIC ne doivent pas être comparés d'un modèle à l'autre si le nombre d'observations n'est pas le même?

Toute aide serait grandement appréciée.

N26
la source
Étant donné que le modèle 2 n'est pas vraiment considéré comme «imbriqué» dans le modèle 1, je ne sais pas à quel point l'utilisation de QIC pour évaluer l'ajustement comparatif serait valide. On pensait que je devais utiliser plusieurs techniques d'imputation pour égaliser le nombre d'observations, puis on pourrait sans doute comparer les valeurs QIC pour ces modèles. Cependant, certaines publications, par exemple «Applied Longitudinal Data Analysis for Epidemiology» de Twisk, ont montré des résultats vraiment incohérents en utilisant des techniques d'IM sur des modèles qui ont des variables de réponse dichotomiques. J'aimerais pouvoir aider davantage.
Iris Tsui
1
Pourquoi les valeurs manquent-elles? Leur absence est-elle systématique d'une manière qui rend les valeurs manquantes fondamentalement différentes des valeurs non manquantes?
Macro

Réponses:

1

J'essaierais certainement l'imputation multiple (par exemple avec des souris ou Amelia dans R), éventuellement avec plusieurs méthodes alternatives pour imputer les valeurs manquantes.

Dans le pire des cas, vous pouvez le considérer comme une analyse de sensibilité.

Joe_74
la source