J'ai quelques données que j'ai ajustées en utilisant un modèle LOESS dans R, me donnant ceci:
Les données ont un prédicteur et une réponse, et elles sont hétéroscédastiques.
J'ai également ajouté des intervalles de confiance. Le problème est que les intervalles sont des intervalles de confiance pour la ligne, alors que je m'intéresse aux intervalles de prédiction. Par exemple, le panneau inférieur est plus variable que le panneau supérieur, mais cela n'est pas capturé dans les intervalles.
Cette question est légèrement liée:
comprendre la bande de confiance d'une régression polynomiale , en particulier la réponse de @AndyW, mais dans son exemple, il utilise l' interval="predict"
argument relativement simple qui existe dans predict.lm
, mais il est absent de predict.loess
.
J'ai donc deux questions très liées:
- Comment obtenir les intervalles de prédiction ponctuels pour LOESS?
- Comment puis-je prédire des valeurs qui captureront cet intervalle, c'est-à-dire générer un tas de nombres aléatoires qui ressembleront finalement un peu aux données d'origine?
Il est possible que je n'aie pas besoin de LOESS et que je doive utiliser autre chose, mais je ne connais pas mes options. Fondamentalement, il devrait correspondre à la ligne en utilisant une régression locale ou une régression linéaire multiple, me donnant des estimations d'erreur pour les lignes, et en plus également des variances différentes pour différentes variables explicatives, afin que je puisse prédire la distribution de la variable de réponse (y) à certaines valeurs de x .
la source
Réponses:
Je ne sais pas comment faire des bandes de prédiction avec la
loess
fonction d' origine mais il y a une fonctionloess.sd
dans lemsir
package qui fait exactement ça! Presque mot pour mot de lamsir
documentation:Votre deuxième question est un peu plus délicate car
loess.sd
elle ne comporte pas de fonction de prédiction, mais vous pouvez la pirater ensemble en interpolant linéairement les moyennes et les SD prédites dont vous sortezloess.sd
(en utilisantapprox
). Ceux-ci peuvent, à leur tour, être utilisés pour simuler des données en utilisant une distribution normale avec les moyennes et les SD prédits:la source
loess.sd
, ce n'est pas trop différent de ce que @rnso a suggéré dans un commentaire à une autre de mes questions . Merci!