Quel est l'intérêt des prieurs non informatifs?

12

Pourquoi même des priors non informatifs? Ils ne fournissent pas d'informations sur . Alors pourquoi les utiliser? Pourquoi ne pas utiliser uniquement des priors informatifs? Par exemple, supposons θ [ 0 , 1 ] . Alors θ U ( 0 , 1 ) est-il un a priori non informatif pour θ ?θθ[0,1]θU(0,1)θ

Robbiee
la source
5
Une récente discussion connexe: stats.stackexchange.com/questions/27589/…
jthetzel
3
Eh bien, si vous n'avez aucune base pour spécifier une priorité, pourquoi voudriez-vous biaiser vos estimations en en attribuant arbitrairement une?
Macro
4
De plus, la distribution uniforme n'est pas un prior non informatif. Par exemple, elle force à être plus probablement proche de 0 que 1 . θ201
Stéphane Laurent

Réponses:

25

Le débat sur les prieurs non informatifs dure depuis des siècles, au moins depuis la fin du XIXe siècle avec les critiques de Bertrand et de Morgan sur le manque d'invariance des prieurs uniformes de Laplace (la même critique rapportée par Stéphane Laurent dans ce qui précède). commentaires). Ce manque d'invariance sonnait comme un coup de mort pour l'approche bayésienne et, alors que certains bayésiens essayaient désespérément de s'accrocher à des distributions spécifiques, en utilisant des arguments moins que formels, d'autres avaient une vision d'une image plus grande où des priors pourraient être utilisés dans des situations où n’était guère d’information préalable, outre la forme de la probabilité elle-même.

je(θ)

π(θ)|je(θ)|1/2

Ces priors donnent en effet une référence par rapport à laquelle on peut calculer l'estimateur / test / prédiction de référence ou son propre estimateur / test / prédiction en utilisant un a priori différent motivé par des informations subjectives et objectives. Pour répondre directement à la question «pourquoi ne pas utiliser uniquement des prieurs informatifs?», Il n'y a en fait pas de réponse. Une distribution préalable est un choix fait par le statisticien, ni un état de la nature ni une variable cachée. En d'autres termes, il n'y a pas de "meilleure priorité" que l'on "doive utiliser". Parce que c'est la nature de l'inférence statistique qu'il n'y a pas de «meilleure réponse».

D'où ma défense du choix non informatif / référence ! Il fournit la même gamme d'outils inférentiels que les autres a priori, mais donne des réponses qui ne sont inspirées que par la forme de la fonction de vraisemblance, plutôt qu'induites par une opinion sur la gamme des paramètres inconnus.

Xi'an
la source