Supposons le modèle de régression bivarié suivant: où est iid pour .
Supposons un a priori non informatif , alors on peut montrer que le pdf postérieur pour est où
Considérons maintenant la valeur de avec une valeur future donnée de , : où est iid , alors nous pouvons montrer que est une densité normale avec espérance et variance Ainsi, la fonction de densité de probabilité postérieure pour , conditionnelle à , est
Maintenant la question est: Spécifiez un intervalle de prédiction de 95% pour et interprétez-le soigneusement. Sur quel (s) aspect (s) du processus de génération de données l'intervalle ne parvient-il pas à tenir compte de notre incertitude?
Je ne sais pas trop comment répondre à la question, mais voici ma tentative:
Donc, nous devons essentiellement trouver quelques et tels que
Nous savons maintenant que où et , d'où:
Maintenant, parce que nous conditionnons sur et regardons l'expression de et , nous voyons que et sont des valeurs connues. On peut donc prendre et . c'est-à-dire que nous pouvons sélectionner de nombreuses autres possibilités de et qui donnent une probabilité de ... mais comment cela se rapporte-t-il à la réponse à la partie de la question qui demande quels aspects du processus de génération de données cet intervalle ne prend pas en compte?
Réponses:
L'intervalle accueille toute l'incertitude du problème. Dans votre description du problème, les seules choses que vous ne savez pas sont et . L'intervalle de prédiction que vous avez dérivé tient compte de l'incertitude des deux. Il n'y a donc plus d'incertitude quant à l'intervalle de "ne pas tenir compte".β u
la source