J'ai 100 patients et chaque patient a 10 mesures longitudinales de la créatinine sérique. Les taux de filtration glomérulaire estimés (DFGe) ont été calculés à partir d'une formule MDRD comprenant le sexe, l'âge et la créatinine sérique. Le DFGe est la variable dépendante et le temps est la variable indépendante en régression linéaire pour chaque patient.
- Les régressions linéaires violent-elles l'hypothèse des «X indépendants» et des modèles mixtes linéaires devraient-ils être utilisés à la place?
- Les pentes du DFGe (qui sont des estimations avec des incertitudes plutôt que des nombres mesurés) estimées à partir de chaque patient (en régressions linéaires pour chaque patient ou dans des modèles mixtes à effets aléatoires [comment estimer les pentes pour chaque patient individuel dans des modèles mixtes?]) Peuvent être utilisées comme variables indépendantes ou dépendantes dans d'autres modèles de régression?
Je vous remercie.
regression
mixed-model
repeated-measures
panel-data
Jinn-Yuh Guh
la source
la source
Réponses:
En effet, vous proposez d'utiliser la régression linéaire comme procédure mathématique pour condenser une observation à 10 variables en une seule variable (la pente). En tant que tel, ce n'est qu'un autre exemple de procédures similaires comme (par exemple) l'utilisation d'une moyenne de mesures répétées comme variable de régression ou l'inclusion des scores des composantes principales dans une régression.
Des commentaires spécifiques suivent.
(1) La régression linéaire n'exige pas que les X (variables indépendantes) soient "indépendants". En effet, dans la formulation standard, le concept d'indépendance ne s'applique même pas parce que les X sont des valeurs fixes, pas des réalisations d'une variable aléatoire.
(2) Oui, vous pouvez utiliser les pentes comme variables dépendantes . Cela aiderait à établir qu'elles pourraient se comporter comme la variable dépendante dans la régression linéaire. Pour les moindres carrés ordinaires, cela signifie que
une. Les pentes peuvent dépendre de certains des attributs du patient.
b. La dépendance est approximativement linéaire, au moins pour la gamme des attributs observés du patient.
c. Toute variation entre une pente observée et la pente hypothétique peut être considérée comme aléatoire.
ré. Cette variation aléatoire est (i) indépendante d'un patient à l'autre et (ii) a approximativement la même distribution d'un patient à l'autre.
e. Comme précédemment, les variables indépendantes ne sont pas considérées comme aléatoires mais comme fixes et mesurées sans erreur appréciable.
Si toutes ces conditions tiennent approximativement, vous devriez être d'accord. Les violations de (d) ou (e) peuvent être corrigées en utilisant des généralisations des moindres carrés ordinaires.
(2 '). Étant donné que les pentes présentent une incertitude (telle que mesurée dans la régression utilisée pour estimer les pentes), elles peuvent ne pas être de bons candidats pour des variables indépendantes , sauf si vous les traitez comme aléatoires dans un modèle mixte ou si vous utilisez un modèle avec erreurs dans les variables.
Vous pouvez également faire face à cette situation grâce à un modèle Bayes hiérarchique .
la source