Qu'est-ce que le bootstrap itératif? Comment est-ce utilisé?
9
Je suis récemment tombé sur une mention de "double / triple bootstrap" ou "bootstrap itératif". Si je comprends bien, chaque échantillon d'amorçage est redémarré.
Il y a beaucoup de variations dans la terminologie avec le bootstrap (où j'ai vu une chose appelée trois noms différents, et j'ai vu le même nom utilisé pour différentes choses). Pouvez-vous indiquer où vous l'avez vu?
Glen_b -Reinstate Monica
@Glen_b Par exemple ihome.ust.hk/~yfong/iterate.pdf Beaucoup d'efforts semblent avoir été consacrés au développement d'algorithmes efficaces pour cela. Donc, clairement, cela doit être utile pour quelque chose. D'après la littérature, je ne peux pas voir quoi sans vraiment y plonger.
Max
@whuber m'a lié à cet article dans une question non liée, mais le chapitre 2 explique très clairement le bootstrapping et le bootstrapping itéré. J'étais tellement inspiré par cela, j'ai écrit un petit article de blog avec quelques exemples.
Cam.Davidson.Pilon
Réponses:
1
Ce document que vous mentionnez dans les commentaires fait référence à Davidson et MacKinnon, qui donnent cette motivation:
Bien que les valeurs de bootstrap P soient souvent très fiables, cela ne sera pas vrai dans tous les cas. Pour un test asymptotique, une façon de vérifier s'il est fiable est simplement d'utiliser le bootstrap. Si les valeurs asymptotiques et bootstrap P associées à une statistique de test donnée sont similaires, nous pouvons être assez confiants que l'asymptotique est raisonnablement précis. Bien sûr, après avoir pris la peine de calculer la valeur de bootstrap P, nous pouvons très bien vouloir l'utiliser à la place de celle asymptotique.
Dans un grand nombre de cas, cependant, les valeurs asymptotiques et bootstrap P sont très différentes. Lorsque cela se produit, il est presque certain que la valeur asymptotique de P est inexacte, mais nous ne pouvons pas être sûrs que le bootstrap est exact. Dans cet article, nous discutons des techniques de calcul des valeurs de bootstrap P modifiées qui auront tendance à être similaires à la valeur de bootstrap P ordinaire lorsque celle-ci est fiable, mais qui devraient souvent être plus précises lorsqu'elle n'est pas fiable. Ces techniques sont étroitement liées au double bootstrap proposé à l'origine par Beran (1988), mais elles sont beaucoup moins coûteuses à calculer. En fait, la quantité d'effort de calcul au-delà de celle nécessaire pour obtenir des valeurs de bootstrap P ordinaires est à peu près égale à la quantité nécessaire pour calculer cette dernière en premier lieu.
Cela semble être une raison assez claire pour (i) effectuer un amorçage itératif et (ii) pour essayer de poursuivre des méthodes efficaces pour le faire - c'est ce que le document que vous pointez et ce document semble essayer de faire.
(Jusqu'à présent, cette réponse ne concerne que la partie «à quoi ça sert?» De la question.)
Réponses:
Ce document que vous mentionnez dans les commentaires fait référence à Davidson et MacKinnon, qui donnent cette motivation:
Cela semble être une raison assez claire pour (i) effectuer un amorçage itératif et (ii) pour essayer de poursuivre des méthodes efficaces pour le faire - c'est ce que le document que vous pointez et ce document semble essayer de faire.
(Jusqu'à présent, cette réponse ne concerne que la partie «à quoi ça sert?» De la question.)
la source