Pour un intervalle de prédiction en régression linéaire vous utilisez encore E [ Y | x ] = ^ ß 0 + β 1 x pour générer l'intervalle. Vous l'utilisez également pour générer un intervalle de confiance de E [ Y | x 0 ] . Quelle est la différence entre les deux?
80
Réponses:
Par conséquent, un intervalle de prédiction sera plus large qu'un intervalle de confiance.
la source
La différence entre un intervalle de prédiction et un intervalle de confiance est l’erreur type.
L'erreur type pour un intervalle de confiance sur la moyenne prend en compte l'incertitude due à l'échantillonnage. La ligne que vous avez calculée à partir de votre échantillon sera différente de la ligne qui aurait été calculée si vous aviez toute la population. L'erreur type prend en compte cette incertitude.
L'erreur type pour un intervalle de prédiction sur une observation individuelle prend en compte l'incertitude due à l'échantillonnage comme ci-dessus, mais prend également en compte la variabilité des individus autour de la moyenne prédite. L'erreur type pour l'intervalle de prédiction sera plus large que pour l'intervalle de confiance et par conséquent, l'intervalle de prédiction sera plus large que l'intervalle de confiance.
la source
J'ai trouvé l'explication suivante utile:
Source: http://www.graphpad.com/support/faqid/1506/
la source
L'une est une prédiction d'une observation future et l'autre est une réponse moyenne prédite. Je donnerai une réponse plus détaillée pour expliquer, espérons-le, la différence et son origine, ainsi que la manière dont cette différence se manifeste à des intervalles plus larges pour la prédiction que pour la confiance.
J'espère que cela explique un peu plus pourquoi l'intervalle de prédiction est toujours plus large et quelle est la différence sous-jacente entre les deux intervalles. Cet exemple a été adapté de Faraway, Linear Models with R, Sec. 4.1.
la source
Réponse courte:
Un intervalle de prédiction est un intervalle associé à une variable aléatoire à observer (prévision).
Un intervalle de confiance est un intervalle associé à un paramètre et est un concept fréquentiste.
Voir réponse complète ici de Rob Hyndman, le créateur du paquet de prévisions dans R.
la source
Cette réponse s’adresse aux lecteurs qui n’ont pas bien compris les réponses précédentes. Discutons d'un exemple spécifique. Supposons que vous essayez de prédire le poids des personnes à partir de leur taille, de leur sexe (masculin, féminin) et de leur régime alimentaire (standard, faible en glucides, végétarien). Actuellement, il y a plus de 8 milliards de personnes sur la Terre. Bien sûr, vous pouvez trouver plusieurs milliers de personnes ayant la même taille et deux autres paramètres mais un poids différent. Leurs poids diffèrent énormément parce que certains d'entre eux souffrent d'obésité et que d'autres peuvent souffrir de la famine. La plupart de ces personnes seront quelque part au milieu.
Une tâche consiste à prédire le poids moyen de toutes les personnes ayant les mêmes valeurs des trois variables explicatives. Ici, nous utilisons l'intervalle de confiance. Un autre problème est de prévoir le poids d’une personne en particulier. Et nous ne connaissons pas les conditions de vie de cet individu. Ici, l'intervalle de prédiction doit être utilisé. Il est centré sur le même point, mais il doit être beaucoup plus large que l’intervalle de confiance.
la source