J'ai un problème où
J'observe y, mais ni ni . Je veux estimer
Je peux estimer , en utilisant une sorte de modèle de régression. Cela me donne . Je pourrais alors estimer
Premier problème: un modèle de régression pour prédire pourrait conduire à être négatif, ce qui n'aurait aucun sens. Je ne sais pas comment contourner cela (pas le genre de problème que j'ai souvent traité), mais cela semble être le genre de chose que les autres traitent régulièrement. Une sorte de GLM non gaussien?
Le principal problème est de savoir comment tenir compte de l'incertitude dans le modèle principal qui provient de l'estimation . J'ai déjà utilisé l'imputation multiple pour les covariables manquantes. Mais c'est un "paramètre latent" manquant. Alternativement, ce sont les données sur les résultats, qui semblent correctes à imputer . Cependant, j'entends souvent parler d'EM utilisé pour les paramètres "latents". Je ne sais pas pourquoi, et je ne sais pas non plus si la ME est meilleure dans ces contextes. L'IM est intuitif à la fois pour comprendre, implémenter et communiquer. EM est intuitif à comprendre, mais semble plus difficile à implémenter (et je ne l'ai pas fait).
L'EM est-il supérieur pour le type de problème que j'ai ci-dessus? Si oui, pourquoi? Deuxièmement, comment peut-on l'implémenter dans R pour un modèle linéaire ou pour un modèle semi-paramétrique (GAM)?
la source
Réponses:
L'utilité ou non d'utiliser les GLM dépend de la distribution de . Je serais enclin à utiliser un modèle des moindres carrés non linéaires pour le tout.y
Donc, si votre modèle de régression est où sont les prédicteurs et sont les paramètres du modèle de régression pour , et votre modèle pour est mais où est limité à être non négatif, vous pouvez écrire et adapter un modèle comme celui-ci:a=Zα+ν Z α a b b=f(x)+ϵ f(x) f(x)=exp(ψ(x))
où est la somme des deux termes de bruit individuels. (Si vous voulez vraiment que sans aucune erreur, vous devez le faire différemment; ce n'est pas vraiment un problème de statistiques autant qu'un problème d'approximation et vous voudrez probablement regarder les normes de l'infini alors.)η y=a+b
Si vous mettez par exemple une spline de régression cubique pour ce serait un moyen facile d'obtenir une fonction lisse générale. Ce modèle pourrait être ajusté par des moindres carrés non linéaires. (En effet, certains algorithmes peuvent profiter de la linéarité d' pour simplifier et accélérer le calcul.)ψ a
Selon ce que vous supposez à propos de ou , vous pouvez faire d'autres choses à la place.y f
Cela ne règle pas encore vraiment le problème d'imputation. Cependant, ce type de cadre de modèle peut être inséré dans quelque chose comme votre suggestion d'utiliser EM.
la source