Cette question a été posée il y a longtemps, mais je poste une réponse au cas où quelqu'un la découvrirait à l'avenir. En bref, la réponse est oui: vous pouvez le faire dans de nombreux paramètres et vous êtes justifié de corriger le changement de taille d'échantillon par le . Cette approche est généralement appelée boostrap sur , et elle fonctionne dans la plupart des paramètres que le bootstrap `` traditionnel '' fait, ainsi que dans certains paramètres dans lesquels elle ne fonctionne pas.MN--√MN
La raison en est que de nombreux arguments de cohérence bootstrap utilisent des estimateurs de la forme , où sont des variables aléatoires et est un paramètre de la distribution sous-jacente. Par exemple, pour la moyenne de l'échantillon, et .1N√( TN- μ )X1, … , XNμTN= 1N∑Ni = 1Xjeμ = E ( X1)
De nombreuses preuves de cohérence bootstrap soutiennent que, comme , étant donné un échantillon fini et une estimation ponctuelle associée ,
où les sont tirés de la vraie distribution sous-jacente et les sont dessinés en remplacement de .N→ ∞{ x1, … , XN}μ N = T N ( x 1 , ... , x N ) √μ^N= TN( x1, … , XN)N--√( TN( X∗1, … , X∗N) - μ^N) →réN--√( TN( X1, … , XN) - μ )(1)
XjeX∗je{ x1, … , XN}
Cependant, nous pourrions également utiliser des échantillons plus courts de longueur et considérer l'estimateur
Il s'avère que, comme , l'estimateur ( ) a la même distribution limite que ci-dessus dans la plupart des paramètres où ( ) détient et certains où il ne le fait pas. Dans ce cas, ( ) et ( ) ont la même distribution limite, motivant le facteur de correction par exemple l'écart type de l'échantillon.M< NM--√( TM( X∗1, … , X∗M) - μ^N) .(2)
M, N→ ∞112√2112MN--√
Ces arguments sont tous asymptotiques et ne tiennent que dans la limite . Pour que cela fonctionne, il est important de ne pas choisir trop petit. Il y a une théorie (par exemple Bickel et Sakov ci-dessous) sur la façon de choisir le optimal en fonction de pour obtenir les meilleurs résultats théoriques, mais dans votre cas, les ressources de calcul peuvent être le facteur décisif.M, N→ ∞M M NMN
Pour une certaine intuition: dans de nombreux cas, nous avons comme , de sorte que
peut être considéré un peu comme un sur bootstrap avec et (j'utilise des minuscules pour éviter toute confusion de notation ). De cette façon, émuler la distribution de ( ) en utilisant un bootstrap sur avec est une chose plus `` juste '' à faire que la traditionnelle ( surμ^N→réμN→ ∞N--√( TN( X1, … , XN) - μ ) ,(3)
mnm = Nn = ∞MNM<NNN3MNM< NNN) gentil. Un avantage supplémentaire dans votre cas est qu'il est moins coûteux à calculer.
Comme vous le mentionnez, Politis et Romano est le principal document. Je trouve Bickel et al (1997) ci-dessous un bon aperçu du bootstrap sur également.MN
Sources :
PJ Bickel, F Goetze, WR van Zwet. 1997. Rééchantillonnage de moins de observations: gains, pertes et remèdes aux pertes. Statistica Sinica.n
PJ Bickel, un Sakov. 2008. Sur le choix de dans le ouf de bootstrap et les bornes de confiance pour les extrema. Statistica Sinica.mmn