Je suis intéressé à obtenir un intervalle de confiance bootstrap sur la quantité X, lorsque cette quantité est mesurée 10 fois pour chacun des 10 individus.
Une approche consiste à obtenir la moyenne par individu, puis à amorcer les moyennes (par exemple, rééchantillonner les moyennes avec remplacement).
Une autre approche consiste à effectuer les opérations suivantes à chaque itération de la procédure d'amorçage: au sein de chaque individu, rééchantillonner les 10 observations de cet individu avec remplacement, puis calculer une nouvelle moyenne pour cet individu, et enfin calculer une nouvelle moyenne de groupe. Dans cette approche, chaque individu observé dans l'ensemble de données d'origine contribue toujours à la moyenne du groupe à chaque itération de la procédure de bootstrap.
Enfin, une troisième approche consiste à combiner les deux approches ci-dessus: rééchantillonner les individus puis rééchantillonner au sein de ces individus. Cette approche diffère de l'approche précédente en ce qu'elle permet au même individu de contribuer à la multiplication de la moyenne du groupe à chaque itération, bien que parce que chaque contribution est générée via une procédure de rééchantillonnage indépendante, on peut s'attendre à ce que ces contributions varient légèrement les unes des autres.
En pratique, je trouve que ces approches produisent des estimations différentes pour l'intervalle de confiance (par exemple avec un ensemble de données, je trouve que la troisième approche donne des intervalles de confiance beaucoup plus grands que les deux premières approches), donc je suis curieux de savoir ce que chacune pourrait être interprété pour représenter.
la source