Quand utiliser le bootstrap vs la technique bayésienne?

12

J'ai un problème d'analyse décisionnelle assez compliqué impliquant des tests de fiabilité et l'approche logique (pour moi) semble impliquer l'utilisation de MCMC pour soutenir une analyse bayésienne. Cependant, il a été suggéré qu'il serait plus approprié d'utiliser une approche d'amorçage. Quelqu'un pourrait-il suggérer une référence (ou trois) qui pourrait soutenir l'utilisation de l'une ou l'autre technique (même pour des situations particulières)? FWIW, j'ai des données provenant de sources multiples et disparates et de quelques / zéro observations d'échec. J'ai également des données au niveau du sous-système et du système.

Il semble qu'une comparaison comme celle-ci devrait être disponible, mais je n'ai pas eu de chance à rechercher les suspects habituels. Merci d'avance pour tout pointeur.

Aengus
la source
1
Étant donné que le bootstrap classique peut être considéré comme une méthode de maximum de vraisemblance mise en œuvre par ordinateur (c'est-à-dire une technique non bayésienne (avant plat)), serait-il préférable de reformuler votre question en quelque chose comme «quand utiliser la technique fréquentiste vs bayésienne ? " Quelques informations sur le bootstrap: stats.stackexchange.com/questions/18469/…
Yevgeny
1
Hmmm..Je suppose que je ne suis pas d'accord. Espérons que le «bootstrap» suggère spécifiquement la caractérisation de l'intervalle; un peu plus concentré que juste «fréquentiste». Au moins, le «bootstrap» éloignera la plupart des fanatiques religieux. Merci aussi pour le lien, mais je connaissais votre commentaire précédent avant de poster ceci.
Aengus
1
Permettez-moi de reformuler, avez-vous des informations préalables utiles ou le problème a-t-il une structure hiérarchique (imbriquée)? Si c'est le cas, alors une technique bayésienne est probablement meilleure (surtout si le nombre de paramètres du modèle est important par rapport à la quantité de données disponibles, donc l'estimation bénéficierait d'un "rétrécissement bayésien"). Sinon, MLE / bootstrap est suffisant.
Yevgeny
Je suppose qu'une autre approche possible consiste à utiliser des modèles à effets mixtes (par exemple en utilisant le package R lme4) pour modéliser la structure hiérarchique à laquelle vous avez fait allusion. Cela aiderait également à stabiliser les estimations pour les modèles (hiérarchiques) avec un grand nombre de paramètres.
Yevgeny
1
Une analyse bootstrap peut très bien être considérée comme une analyse bayésienne, donc votre question pourrait presque aussi bien être «Quand utiliser le bootstrap contre un autre modèle bayésien» (votre question m'a poussé à rédiger cette interprétation du bootstrap comme un modèle bayésien : sumsar.net/blog/2015/04/… ). Compte tenu de la question, je suis d'accord avec @Yevgeny que nous aurions probablement besoin de plus d'informations concernant votre problème spécifique avant de pouvoir recommander un modèle.
Rasmus Bååth

Réponses:

15

À mon avis, la description de votre problème met en évidence deux problèmes principaux. Premier:

J'ai une analyse de décision assez compliquée ...

En supposant que vous avez une fonction de perte en main, vous devez décider si vous vous souciez du risque fréquentiste ou de la perte attendue postérieure . Le bootstrap vous permet d'approximer les fonctionnalités de la distribution des données, il vous aidera donc avec la première; et des échantillons postérieurs de MCMC vous permettront d'évaluer ce dernier. Mais...

J'ai également des données au niveau du sous-système et du système

ces données ont donc une structure hiérarchique. Les modèles d'approche bayésienne ces données très naturellement, alors que l'amorce a été initialement conçu pour les données modélisées comme IID Bien qu'il a été étendu aux données hiérarchiques (voir les références dans l'introduction de cet article ), ces approches sont relativement peu développés (selon le résumé de cet article ).

Pour résumer: si c'est vraiment le risque fréquentiste qui vous intéresse, alors des recherches originales dans l'application du bootstrap à la théorie de la décision peuvent être nécessaires. Cependant, si minimiser la perte attendue postérieure est un ajustement plus naturel à votre problème de décision, Bayes est certainement la voie à suivre.

Cyan
la source
Merci, je ne les avais rencontrés; ce dernier article semble particulièrement intéressant.
Aengus
5

J'ai lu que le bootstrap non paramétrique peut être vu comme un cas particulier d'un modèle bayésien avec un a priori discret (très) non informatif, où les hypothèses formulées dans le modèle sont que les données sont discrètes et le domaine de votre distribution cible est complètement observée dans votre échantillon.

Voici deux références:

Steve
la source