Intervalles de confiance bootstrap sur les paramètres ou sur la distribution?

9

Excusez ce qui peut être une question évidente à propos du bootstrap. J'ai été aspiré très tôt dans le monde bayésien et je n'ai jamais vraiment exploré le bootstrapping autant que j'aurais dû.

J'ai parcouru une analyse dans laquelle les auteurs étaient intéressés par une analyse de survie liée à un certain temps avant l'échec des données. Ils avaient environ 100 points et ont utilisé la régression pour ajuster une distribution de Weibull aux données. En conséquence, ils ont obtenu des estimations des paramètres d'échelle et de forme. Une approche très traditionnelle. Cependant, ils ont ensuite utilisé le bootstrap pour échantillonner à partir de l'ensemble de données d'origine et, pour chaque nouvel échantillon, ont effectué une régression et ont trouvé une nouvelle distribution de Weibull. Les résultats du bootstrap ont ensuite été utilisés pour construire des intervalles de confiance sur la distribution de survie.

Mon intuition est un peu conflictuelle. Je suis familier avec l'amorçage des intervalles de confiance sur les paramètres, mais je ne l'ai pas vu utilisé pour construire des intervalles de confiance de distribution.

Quelqu'un peut-il m'orienter vers une référence / source qui pourrait fournir des informations? Merci d'avance.

Aengus
la source
3
La question est en fait plus générale que vous ne le pensez, car peu importe la façon dont les paramètres ont été estimés. Le nœud du problème est que les paramètres déterminent complètement les distributions. Ainsi, un ensemble de CI simultanés sur les paramètres est un CI pour les distributions.
whuber
Je comprends cela et c'est peut-être aussi simple que cela. Peut-être que ce qui me harcèle, c'est que le bootstrapping est livré avec ses propres bagages et je me demandais s'il y avait quelque chose dans la procédure qui introduit des problèmes supplémentaires lorsqu'elle est utilisée pour cette prochaine étape. D'un autre côté, ce pourrait être juste ce que j'avais pour le petit déjeuner qui rongeait. Merci pour le commentaire rapide.
Aengus
Je dois être le petit déjeuner :-)
whuber
4
Il existe au moins deux façons de démarrer. La manière la plus simple est de simplement tirer un échantillon aléatoire des observations données et d'estimer les temps b du modèle (bootstrap "paires"). Vous pouvez également bootstrap en utilisant les résidus d'un modèle (bootstrap "résidus"). La première néglige la structure d'erreur dans les données, que la deuxième méthode suppose implicitement que votre modèle est correct. Efron et Tibshirani (1993). "Une introduction au Bootstrap" est le point de départ.
Jason Morgan

Réponses:

1

Fondamentalement, si vous disposez d'un intervalle de confiance conjoint pour les paramètres qui décrivent de manière unique une distribution, vous disposez d'un intervalle de confiance de distribution. Donc, votre problème disparaît ... selon le commentaire de whuber.

Peter Ellis
la source