Prédire

7

Mon modèle estimé est

ln^(yt)=9.8730.472ln(xt2)0.01xt3

On me demande de trouver un IC prédictif à 95% de confiance pour la moyenne de , lorsque et . Nous devons supposer que , où .y0x02=250x03=8s2x0(XTX)1x0T=0.000243952x0=(250,8)

J'ai une solution d'une année précédente, qui va comme ceci:

Je trouve le CI de la forme , où est le quantile supérieur de distribution et . Cela me donne .CI(E[ln(y0)|x0])=[ln^(yt)tα/2sE,ln^(yt)+tα/2sE]tα/2t(nk)sE=0.000243952[7.1563,7.2175]

Ensuite, l'auteur fait .CI(E[y0|x0])=[e7.1563,e7.2175]=[1282.158,1363.077]

Je ne suis pas d'accord avec cette dernière étape (par l'inégalité de Jensen, nous sous-estimerons). Dans l'Introduction à l'économétrie de Wooldridge, à la page 212, il déclare que si nous sommes sûrs que les termes d'erreur sont normaux, alors un estimateur cohérent est:

E^[y0|x0]=es2/2eln^(y0)

Donc, je pensais faire

CI(E[y0|x0])=[es2/21282.158,es2/21363.077]=[1282.314,1363.243]

Est-ce correct?

En outre, la solution de cet exercice indique que , ce qui est loin de l'une ou l'autre solution que j'ai.CI(E[y0|x0])=[624.020,663.519]

Toute aide serait appréciée.

PS: J'ai également lu que la correction ne doit pas être utilisée pour le CI mais uniquement pour l'estimation ponctuelleE^[y0|x0]

Un vieil homme dans la mer.
la source

Réponses:

3

Vous ne trouvez pas la même réponse à cause de ce que je soupçonne être une erreur typographique, ce qui serait donc la principale raison de votre problème: serait réglé sur , pas . Une autre possibilité, si vous conservez , est une erreur dans le deuxième coefficient estimé, par exemple, au lieu de .x03808x03=8β^2=0.10.01

Quoi qu'il en soit, l'une de ces modifications résout tout et donne le même résultat que la solution à cet exercice.

Compte tenu de ce changement, avec , on obtienttα/2=1.96476138969835

Méthode 1

CI(E[y0|x0])=[e6.43618291164626,e6.49755798189177]=[624.020307335178,663.519326788772] (la solution donnée pour cet exercice)

ou

Méthode 2

(comme indiqué dans l'Introduction à l'économétrie de Wooldridge, à la page 212) si nous sommes sûrs que les termes d'erreur sont normaux (et l'un est extrêmement chanceux)

CI(E[y0|x0])=[es2/2624.0203,es2/2663.5193]=[624.0960,663.6002]

toutefois

il est très peu probable que la méthode 2 soit correcte, car, comme vous le mentionnez dans votre question, la [...] correction (sous-estimation) ne devrait pas être utilisée pour l'IC mais uniquement pour l'estimation ponctuelle.

Pourquoi ? Je dirais qu'en raison de la dépendance entre les deux termes, connaître les attentes de une part et d'autre part ne signifie pas que l'on connaisse celle d' .es2/2y0^es22+ln(y0)^

rester en vie
la source
2

La prédiction ponctuelle et l'IC sont différents.

Pour la prédiction ponctuelle, nous avons intérêt à corriger le biais autant que possible. Pour CI, ce qui est requis depuis le début est que la probabilité soit égale à . Lorsque est l'IC à 95% pour par exemple, est certainement un IC à 95% pour parce que . Votre est donc certainement un CI valide.100(1α)%[a,b]ln(y0)[ea,eb]y0P(alnXb)=P(eaXeb)[e7.1563,e7.2175]

Mais le centre de ce CI n'est ni le prédicteur naïf (exp [prédicteur de ]) ni le prédicteur corrigé de (un facteur de correction multiplié par le prédicteur naïf) en raison de l'inégalité de Jensen, mais cela n'a pas vraiment d'importance. Dans certains cas (pas toujours), vous pouvez être en mesure de changer le CI en pour certains et sorte que la probabilité est toujours de 95% et son centre est le biais- prédicteur corrigé, mais je n'y vois pas l'intérêt.lny0y0[eap,ebq]pq

Ce que vous avez suggéré, c'est-à-dire que n'est pas un IC à 95%. Pour voir pourquoi, supposons que le facteur de correction soit (non aléatoire et parfaitement connu, par souci de simplicité), donc le prédicteur à biais corrigé est , où est le prédicteur sans biais de ( dans votre exemple). Ce " " peut être estimé par par exemple, mais alors que ce dernier est aléatoire, est supposé non aléatoire afin de le rendre simple. Soit l'IC à 95% pour , c'est-à-dire[es2/2ea,es2/2eb]hheθθlny0β^0+β^2lnx2+β^3x3hes2/2h[a,b]lny0P(alny0b)=0.95. Alors, qui n'est pas égal à sauf si la distribution de est uniforme, ce qui n'est généralement pas le cas.

P(heay0heb)=P(lnh+alny0lnh+b),
P(alny0b)=0.95lny0

ÉDITER

Ce qui précède concerne le CI de , pas de . La question initiale concerne le CI pour . Soit , qui est estimé par . Dans ce cas, je pense que la méthode Delta est une option utile (voir la réponse de luchonacho).y0E(y|X=x0)E(y|X=x0)E(y|X=x0)=hexp(x0β)h^exp(x0β^)

Pour être rigoureux, nous avons besoin de la distribution conjointe de et , ou pour être précis, la distribution asymptotique du vecteur . Ensuite, la distribution limite de est dérivée en utilisant la méthode Delta puis les CI pour peut être construit.h^β^n[(β^β),h^h]n[h^exp(x0β^)hexp(x0β)]hexp(x0β)

chan1142
la source
Merci d'avoir répondu à Chan. Soit dit en passant, dans cet exercice, l'estimateur ponctuel pour ou est égal. L'estimation résultante est en dehors de l'IC pour mais à l'intérieur de l'IC pour . Ne devraient-ils pas tous deux être à l'intérieur de leur CI? y0E(y|X0)E(y|X0)y0
Un vieil homme dans la mer.
Oui, ça aide. Pourriez-vous vérifier ma question. C'est lié à ça. economics.stackexchange.com/questions/16891/…
Un vieil homme dans la mer.
Dans un commentaire que j'ai fait et supprimé, j'ai fait une erreur. est bien sûr différent de comme réponse d'Alecos Papadopoulos à vos questions. Merci beaucoup @Anoldmaninthesea, et désolé. Je pensais peut-être que est suffisamment proche de , ce qui n'est pas ce que vous avez soulevé. Hmm, dans ce cas, votre remarque est encore plus intéressante. E(y|X=x0)exp{E(logy|X=x0)}exp(x0β^)exp(x0β)
chan1142
1
Je n'ai jamais pensé à ce problème. Je saurai. Il s'agit donc du CI pour . La méthode Delta expliquée par luchonacho semble utile dans ce cas. Merci @Anoldmaninthesea de l'avoir soulevé. E(y|X=x0)
chan1142
Chan, j'ai lié une autre de mes questions à celle-ci. Vous y trouverez une réponse que j'ai écrite que vous pourriez trouver intéressante.
Un vieil homme dans la mer.
1

Utilisez la méthode Delta . Supposons que la distribution asymptotique des grands échantillons d'un seul paramètre soit:β

β^aN(β,Var(β^)n)

(en supposant que votre estimation est cohérente)

De plus, vous êtes intéressé par une fonction de , disons . Ensuite, une approximation de Taylor de premier ordre de ce qui précède conduit à la distribution asymptotique suivante:β^F(β^)

F(β^)aN(F(β),(F(β^)β^)2Var(β^)n)

Dans votre cas, est . De là, vous pouvez construire le CI comme d'habitude.F(β^)eβ^

Source et plus de détails dans le document lié.

luchonacho
la source
lucho, je ne peux pas utiliser la méthode Delta pour ça ... mais merci quand même. ;)
Un vieil homme dans la mer.
: o pourquoi pas? Une supposition que j'ai mal lue ou non énoncée?
luchonacho
1
Ce n'est tout simplement pas le but de l'exercice. Je suis vraiment intéressé de savoir laquelle de la méthode est correcte. De plus, votre méthode donne une distribution approximative, alors que dans l'exercice, ils veulent un CI exact.
Un vieil homme dans la mer.