Pourquoi les données devraient-elles être rééchantillonnées sous hypothèse nulle dans les tests d'hypothèse bootstrap?

11

L'application directe des méthodes de bootstrap pour les tests d'hypothèses est d'estimer l'intervalle de confiance de la statistique de test θ en calculant de façon répétée sur les échantillons bootstrap de (Soit la statistique θ échantillonné à partir bootstrap être appelé ^ θ * ). Nous rejetons H 0 si le paramètre hypothétique θ 0 (qui est généralement égal à 0) se situe en dehors de l'intervalle de confiance de ^ θ .θ^θ^θ^H0θ0θ^

J'ai lu que cette méthode manque de puissance. Dans l'article de salle P. Wilson et SR « Deux lignes directrices pour Bootstrap Test d' hypothèse » (1992) il est écrit que la première directive, que l' on devrait rééchantillonner , pas ^ θ * - θ 0 . Et c'est la partie que je ne comprends pas.θ^θ^θ^θ0

Est -ce pas le mesures juste le biais de l'estimateur ^ θ * ? Pour les estimateurs sans biais les intervalles de confiance de cette expression doit toujours être inférieure à ^ θ * - θ 0 , mais je ne vois pas , ce qu'elle a à voir avec le test pour θ = θ 0 ? Il n'y a nulle part où je peux voir que nous mettons des informations sur le θ 0 .θ^θ^θ^θ^θ0θ^=θ0θ0


Pour ceux d'entre vous, qui n'ont pas accès à cet article, voici une citation du paragraphe pertinent qui vient immédiatement après la thèse:

Pour comprendre pourquoi c'est important, observez que le test impliquera de rejeter si dans | Θ - θ 0 | est "trop ​​grand". Si θ 0 est loin de la vraie valeur de θ (c'est-à-dire si H 0 est grossièrement l'erreur) alors la différence | Θ - θ 0 | ne sera jamais très gros par rapport à la distribution bootstrap non paramétrique de | Θ - θ 0 | . Une comparaison plus significative est avec la distribution deH0|θ^θ0|θ0θH0|θ^θ0||θ^θ0|. En fait, si la vraie valeur deθest θ 1, alors la puissance du test de bootstrap augmente à 1 comme | θ 1 - θ 0 | augmente, à condition que le test soit basé sur le rééchantillonnage | ^ Θ * - θ | , mais la puissance diminue au maximum au niveau de signification (lorsque | θ 1 - θ 0 | augmente) si le test est basé sur le rééchantillonnage | θ -|θ^θ^|θθ1|θ1θ0||θ^θ^||θ1θ0||θ^θ0|

Adam Ryczkowski
la source

Réponses:

7

Fx1,,xnFnθ^=T(Fn)T()F~T()θ^θ0θ^F~T()T(F~)F~=FnT(Fn)θ^

tχ2μ=0x¯=0.78χ2(x¯μ)2/(s2/n)x¯2/(s2/n)x¯2/(s2/n)nx¯2/s2dès le départ, au lieu d'être un test central comme on pourrait s'y attendre. Pour que le test de bootstrap soit central, vous devez vraiment soustraire l'estimation initiale.

χ2χ2

StasK
la source
θ0H0θ0
θ0
3

OK, je l'ai. Merci, StasK, pour une si bonne réponse. Je le garderai accepté pour que d'autres l'apprennent, mais dans mon cas particulier, il me manquait un fait très simple:

La procédure de bootstrap conformément aux directives de Hall & Wilson pour un test moyen simple à un échantillon est la suivante (en pseudo-code inspiré de R):

1function(dataθ0 ) {
2 θ^ t.test(data, mu = θ0 )$statistic
3 count 0
4for(i in 1:1000){
5 bdata sample(data)
6 θ^ t.test(bdata, mu = θ^ )$statistic
7 if ( θ^θ^ ) count++
8 }
9 count/1000
10 }

θ02θ^

26p.valuestatistic7

Adam Ryczkowski
la source
θ^θθ0(θ^θ^)(θ^θ0)
1
Peut-être utile: Michael Chernick a fourni une intuition succincte en réponse à ma question connexe ici. stats.stackexchange.com/questions/289236/… )
demi-passe