Variance de la moyenne de l'échantillon de l'échantillon bootstrap

9

Soit des observations distinctes (pas de liens). Soit un échantillon bootstrap (un échantillon du CDF empirique) et laissez . Recherchez et . X * 1 , . . . , X n ˉ X n = 1X1,...,XnX1,...,Xn E( ˉ X n )Var( ˉ X n )X¯n=1nje=1nXjeE(X¯n)Vuner(X¯n)

Ce que j'ai jusqu'à présent, c'est que Xje est chacun avec une probabilité donc et ce qui donne 1X1,...,Xn E(Xi )=11nE(X2 i )=1

E(Xje)=1nE(X1)+...+1nE(Xn)=nμn=μ
V a r ( X i ) = E ( X 2 i ) - ( E ( X i ) ) 2 = μ 2 + σ 2 - μ 2 = σ 2
E(Xje2)=1nE(X12)+...+1nE(Xn2)=n(μ2+σ2)n=μ2+σ2,
Vuner(Xje)=E(Xje2)-(E(Xje))2=μ2+σ2-μ2=σ2.

Ensuite, et depuis le ' s sont indépendants. Cela donne

E(X¯n)=E(1nje=1nXje)=1nje=1nE(Xje)=nμn=μ
Vuner(X¯n)=Vuner(1nje=1nXje)=1n2je=1nVuner(Xje)
XjeVuner(X¯n)=nσ2n2=σ2n

Cependant, je n'obtiens pas la même réponse lorsque je conditionne sur et j'utilise la formule de variance conditionnelle: X1,,Xn

Vuner(X¯n)=E(Vuner(X¯n|X1,...,Xn))+Vuner(E(X¯n|X1,,Xn)).

E(X¯n|X1,,Xn)=X¯n et donc les brancher dans la formule ci-dessus donne (après quelques algèbres) .Vuner(X¯n|X1,,Xn)=1n2(Xje2-nX¯n2)Vuner(X¯n)=(2n-1)σ2n2

Est-ce que je fais quelque chose de mal ici? J'ai l'impression que je n'utilise pas correctement la formule de variance conditionnelle, mais je n'en suis pas sûr. Toute aide serait appréciée.

rrruss
la source
Peut-être que votre V (E (X | X1..Xn)) n'est pas correctement calculé. La réponse devrait être la même.
Vous avez probablement raison - mais cette réponse ne semble pas terriblement informative. Peut-être pourriez-vous indiquer quelle partie n'est pas correcte?
whuber

Réponses:

5

La bonne réponse est . La solution est n ° 4 icin-1n2S2

Greg
la source
4

Cela peut être une réponse tardive, mais ce qui ne va pas dans votre calcul est le suivant: vous avez supposé que votre échantillon bootstrap est inconditionnellement iid. C'est faux: conditionnel à votre échantillon, l'échantillon de bootstrap est en effet iid, mais vous perdez inconditionnellement l'indépendance (mais vous avez toujours des variables aléatoires distribuées de manière identique). Il s'agit essentiellement de l'exercice 13 dans Larry Wasserman Toutes les statistiques non paramétriques .

M Turgeon
la source