Je voulais estimer l'intervalle de confiance pour l'écart-type de certaines données. Le code R ressemble à ceci:
library(boot)
sd_boot <- function (x, ind) {
res <- sd(x$ReadyChange[ind], na.rm = TRUE)
return(res)
}
data_boot <- boot::boot(data, statistic = sd_boot, R = 10000)
plot(data_boot)
Je suis coincé avec l'interprétation correcte de cet histogramme de bootstraps. Tous les autres ensembles de données similaires montrent des distributions normales des estimations de bootstrap ... Mais pas cela. Soit dit en passant, il s'agit de données brutes réelles:
> data$ReadyChange
[1] 27.800000 8.985046 11.728021 8.830856 5.738600 12.028310 7.771528 9.208924 11.778611 6.024259 5.969931 6.063484 4.915764
[14] 12.027639 9.111146 13.898171 12.921377 6.916667 10.764479 6.875000 12.875000 7.017917 9.750000 7.921782 12.911551 6.000000
Pouvez-vous m'aider à interpréter ce modèle de bootstrap?
Réponses:
Vous pourriez avoir un bogue dans votre code, ou la bibliothèque d'amorçage fait autre chose que prévu.Éditer:
Après que les données corrigées ont été fournies, il est devenu évident que le motif était causé par une valeur aberrante, chaque pic correspondant au nombre différent de fois où la valeur aberrante a été sélectionnée dans un échantillon.
la source
inds <- matrix(sample(21,10000*21,replace=TRUE),10000,21)
, puis recherchez les éléments de données de chaque colonne et trouvez l'écart-type avechist(apply(inds,1,function(ind){sd(data[ind])}))
. Il n'y a pas de pics multiples.J'hésite à poser cela comme une réponse, mais pour moi, cela semble être causé par la petite quantité de points de données sur lesquels vous basez votre bootstrap (21, corrigez-moi si je me trompe).
Pour être plus précis, il me semble que ces 21 valeurs spécifiques , à partir desquelles vous échantillonnez, n'ont que quelques écarts-types fréquemment possibles (les pics de votre histogramme). Si l'échantillon de base était plus grand et plus diversifié, l'histogramme résultant serait beaucoup plus lisse (et probablement plus semblable à la distribution normale que vous attendiez).
Sur une note générale et en supposant que je suis à droite ici, c'est un bon exemple pour montrer que le bootstrap ne résout pas les problèmes d'avoir un petit échantillon.
la source