J'ai 383 échantillons qui ont un biais important pour certaines valeurs communes, comment calculer l'IC à 95% pour la moyenne? L'IC que j'ai calculé semble très éloigné, ce que je suppose parce que mes données ne ressemblent pas à une courbe lorsque je fais un histogramme. Je pense donc que je dois utiliser quelque chose comme le bootstrap, que je ne comprends pas très bien.
confidence-interval
mean
IhaveCandy
la source
la source
Réponses:
Oui, le bootstrap est une alternative pour obtenir des intervalles de confiance pour la moyenne (et vous devez faire un peu d'effort si vous voulez comprendre la méthode).
L'idée est la suivante:
Concernant la dernière étape, il existe plusieurs types d'intervalle de confiance bootstrap (BCI). Les références suivantes présentent une discussion sur les propriétés des différents types de BCI:
http://staff.ustc.edu.cn/~zwp/teach/Stat-Comp/Efron_Bootstrap_CIs.pdf
http://www.tau.ac.il/~saharon/Boot/10.1.1.133.8405.pdf
C'est une bonne pratique de calculer plusieurs BCI et d'essayer de comprendre les écarts possibles entre eux.
Dans R, vous pouvez facilement implémenter cette idée en utilisant le package R 'boot' comme suit:
la source
Une autre alternative standard consiste à calculer l'IC avec le test de Wilcoxon. Dans R
Malheureusement, cela vous donne l'IC autour de la (pseudo) médiane et non la moyenne, mais si les données sont fortement anormales, la médiane est peut-être une mesure plus informative.
la source
Pour les données log-normales, Olsson (2005) suggère une «méthode de Cox modifiée»
Une fonction R est ci-dessous:
Répéter l'exemple du document d'Olsson
la source
la source