Cette question a été déclenchée par quelque chose que j'ai lu dans ce manuel de statistiques de deuxième cycle et que j'ai entendu (indépendamment) lors de cette présentation lors d'un séminaire statistique. Dans les deux cas, la déclaration était dans les lignes de "parce que la taille de l'échantillon est assez petite, nous avons décidé d'effectuer une estimation via bootstrap au lieu de (ou avec) de cette méthode paramétrique ".
Ils ne sont pas entrer dans les détails, mais sans doute le raisonnement est le suivant: la méthode suppose que les données suivent une certaine distribution paramétrique D . En réalité, la distribution n'est pas exactement D , mais c'est correct tant que la taille de l'échantillon est suffisante. Puisque dans ce cas, la taille de l'échantillon est trop petite, passons au bootstrap (non paramétrique) qui ne fait pas d'hypothèses de distribution. Problème résolu!
À mon avis, ce n'est pas à cela que sert bootstrap. Voici comment je vois les choses: bootstrap peut donner un avantage lorsqu'il est plus ou moins évident qu'il y a suffisamment de données, mais il n'y a pas de solution de forme fermée pour obtenir des erreurs standard, des valeurs p et des statistiques similaires. Un exemple classique consiste à obtenir un CI pour le coefficient de corrélation à partir d’un échantillon d’une distribution normale bivariée: la solution sous forme fermée existe, mais elle est tellement compliquée que l’amorçage est plus simple. Cependant, rien n'implique que bootstrap puisse d'une manière ou d'une autre aider quelqu'un à s'en sortir avec un échantillon de petite taille.
Est-ce que ma perception est correcte?
Si vous trouvez cette question intéressante, voici une autre question plus spécifique sur le bootstrap:
Bootstrap: le problème de l'overfitting
PS Je ne peux pas m'empêcher de partager un exemple flagrant de la «méthode du bootstrap». Je ne divulgue pas le nom de l'auteur, mais il est l'un des «quants» de la génération la plus âgée qui a écrit un livre sur la finance quantitative en 2004. L'exemple est pris de là.
Considérez le problème suivant: supposons que vous avez 4 actifs et 120 observations de rendement mensuel pour chacun. L’objectif est de construire la cdf commune en 4 dimensions des déclarations annuelles. Même pour un seul actif, la tâche semble difficilement réalisable avec seulement 10 observations annuelles, sans parler de l’estimation de la cdf à 4 dimensions. Mais ne vous inquiétez pas, le «bootstrap» vous aidera: prenez toutes les observations à 4 dimensions disponibles, rééchantillonnez 12 avec remplacement et combinez-les pour construire un seul vecteur de déclaration annuelle à 4 dimensions «bootstrapped». Répétez cela 1 000 fois et, voilà, vous vous êtes procuré un «échantillon bootstrap» de 1 000 déclarations annuelles. Utilisez-le comme échantillon iid de taille 1000 aux fins de l'estimation de la cdf ou de toute autre inférence pouvant être tirée d'un historique de mille ans.
la source
Réponses:
Mes résultats pour une course sont:
la source
boot
paquet et je lui ai demandé de fournir tous les intervalles possibles: l'intervalle d'approximation normal du premier ordre, l'intervalle d'amorçage de base, l'intervalle d'amorçage studentisé, l'intervalle de centile d'amorçage (que votre code fournit déjà) et le centile d'amorçage ajusté (BCa). intervalle. Les résultats étaient pratiquement tous identiques (taux de rejet d'environ 0,16 à 0,17), à l'exception de l'intervalle de Student, qui présentait un taux de rejet nominal (0,05) (ce qui est logique, car il ressemble davantage au test t standard).10,000 \times 10,000
itérations (cela a pris quelques minutes de plus) et de pouvoir vérifier les choses. Et votre exemple montre bien que le bootstrap peut très mal fonctionner avec de petits échantillons même lorsque les choses sont "agréables" (c'est-à-dire que les données sont en fait normales).Si vous disposez d'un échantillon de petite taille (comme lumière latérale, ce qui est "petit" semble dépendre d'une règle coutumière sous-jacente dans chaque domaine de recherche), aucun bootstrap ne fera la magie. En supposant qu'une base de données contienne trois observations pour chacune des deux variables à l'étude, aucune inférence n'aura de sens. D'après mon expérience, le bootstrap non paramétrique (1 000 ou 10 000 réplications) remplace bien le test t lorsque les distributions d'échantillons (au moins 10 à 15 observations chacune) sont asymétriques et que, par conséquent, les conditions préalables du test t habituel ne sont pas remplies. En outre, quel que soit le nombre d'observations, le bootstrap non paramétrique peut être un choix obligatoire lorsque les données sont positivement asymétriques, comme cela se produit toujours pour les coûts des soins de santé.
la source
D'autres réponses critiquent les performances des intervalles de confiance bootstrap , et non pas les bootstrap eux-mêmes. C'est un problème différent.
Si votre contexte remplit les conditions de régularité pour la convergence de la distribution bootstrap (convergence en termes de nombre d'échantillons bootstrap), alors la méthode fonctionnera si vous utilisez un échantillon bootstrap suffisamment grand.
Si vous souhaitez vraiment résoudre les problèmes liés à l’utilisation de bootstrap non paramétrique, voici deux problèmes:
(1) Problèmes de rééchantillonnage.
L’un des problèmes liés au bootstrap, que ce soit pour les échantillons de petite taille ou de grande taille, est l’étape de ré-échantillonnage. Il n'est pas toujours possible de ré-échantillonner tout en conservant la structure (dépendance, temporelle, ...) de l'échantillon. Un exemple de ceci est un processus superposé .
Comment voulez-vous rééchantillonner tout en conservant la structure de dépendance inconnue ?
(2) Échantillons bootstrap étroits et intervalles de confiance bootstrap pour les petits échantillons .
Dans les petits échantillons, le minimum et le maximum des estimateurs de chaque sous-échantillon peuvent définir un intervalle étroit, puis les extrémités extrêmes droite et gauche de tout intervalle de confiance seront très étroites (ce qui est contre-intuitif compte tenu du petit échantillon!) Dans certains modèles.
la source
Bootstrap fonctionne bien dans la petite taille des échantillons en assurant l'exactitude des essais (par exemple , que le niveau de signification de 0,05 nominal est proche de la taille réelle du test), mais le bootstrap ne pas vous accorder la puissance supplémentaire par magie. Si vous avez un petit échantillon, vous avez peu de pouvoir, à la fin de l'histoire.
Les régressions paramétriques (modèles linéaires) et semiparamétriques (GEE) tendent à avoir de médiocres propriétés de petit échantillon ... le premier en raison d'une forte dépendance à des hypothèses paramétriques, le second en raison du grossissement d'estimations d'erreur standard robustes dans de petits échantillons. L’amorçage (et d’autres tests basés sur le ré-échantillonnage) fonctionne vraiment bien dans ces circonstances.
Pour la prédiction, l’amorçage vous donnera de meilleures estimations (plus honnêtes) de la validité interne que la validation d’un échantillon fractionné.
la source