Je traite généralement des données où plusieurs individus sont chacun mesurés plusieurs fois dans chacune de 2 conditions ou plus. J'ai récemment joué avec la modélisation à effets mixtes pour évaluer les preuves des différences entre les conditions, la modélisation individual
comme un effet aléatoire. Pour visualiser l'incertitude concernant les prédictions d'une telle modélisation, j'ai utilisé le bootstrap où, à chaque itération du bootstrap, des individus et des observations dans des conditions dans des individus sont échantillonnés avec remplacement et un nouveau modèle à effets mixtes est calculé à partir duquel les prédictions on obtient. Cela fonctionne bien pour les données qui supposent une erreur gaussienne, mais lorsque les données sont binomiales, le bootstrapping peut prendre très longtemps car chaque itération doit calculer un modèle à effets mixtes binomiaux relativement intensif en calcul.
J'ai pensé que je pouvais éventuellement utiliser les résidus du modèle d'origine, puis utiliser ces résidus au lieu des données brutes dans le bootstrapping, ce qui me permettrait de calculer un modèle gaussien à effets mixtes à chaque itération du bootstrap. L'ajout des prédictions originales du modèle binomial des données brutes aux prédictions bootstrap des résidus donne un IC de 95% pour les prédictions originales.
Cependant, j'ai récemment codé une simple évaluation de cette approche, ne modélisant aucune différence entre deux conditions et calculant la proportion de fois où un intervalle de confiance à 95% n'a pas inclus zéro, et j'ai trouvé que la procédure de bootstrap basée sur les résidus ci-dessus donne des résultats plutôt fortement anti intervalles conservateurs (ils excluent zéro plus de 5% du temps). De plus, j'ai ensuite codé (même lien que le précédent) une évaluation similaire de cette approche appliquée à des données qui étaient à l'origine gaussiennes, et elle a obtenu des IC anti-conservateurs similaires (mais pas aussi extrêmes). Une idée pourquoi cela pourrait être?
la source
Réponses:
N'oubliez pas que tous les intervalles de confiance bootstrap ne sont asymptotiquement qu'au niveau de confiance indiqué. Il existe également une multitude de méthodes possibles pour sélectionner les intervalles de confiance du bootstrap La méthode centile d'Efron, la méthode centile de Hall, le double bootstrap, le bootstrap t, le bootstrap incliné, BC, BCa et peut-être quelques autres. Vous ne nous avez pas dit quelle méthode vous utilisez. L'article de Schenker dans JASA 1985 a montré que pour certaines distributions du chi carré, l'intervalle de confiance du bootstrap de la Colombie-Britannique couvrait le pourcentage annoncé. Dans les problèmes de petite taille d'échantillon, ce problème peut être grave. LaBudde et moi avons deux articles montrant comment dans de petits échantillons, même BCa peut avoir une couverture très médiocre lors de l'estimation d'une variance à partir d'une distribution log-normale et un problème similaire existe pour tester l'égalité de deux variances. C'est juste pour un problème simple. Je pense que la même chose peut se produire avec les résidus de modèles mixtes. Dans notre nouveau livre "An Introduction to Bootstrap Methods with Applications to R" publié par Wiley en 2011, nous couvrons ce sujet dans la section 3.7 et fournissons des références. La surprise est que la méthode centile fait parfois mieux que la méthode BCa précise d'ordre supérieur, lorsque la taille de l'échantillon est petite.
la source