Identique ou différent? La voie bayésienne

10

Disons que j'ai le modèle suivant:

Poisson(λ){λ1si t<τλ2si tτ

Et je déduis les postérieurs de et montrés ci-dessous à partir de mes données. Existe-t-il une manière bayésienne de dire (ou de quantifier) ​​si et sont identiques ou différents ?λ 2 λ 1 λ 2λ1λ2λ1λ2

Peut-être mesurer la probabilité que soit différent deλ 2λ1λ2 ? Ou peut-être en utilisant des divergences KL?

Par exemple, comment puis-je mesurer , ou au moins, ?p ( λ 2 > λ 1 )p(λ2λ1)p(λ2>λ1)

En général, une fois que vous avez les postérieurs illustrés ci-dessous (supposez des valeurs PDF non nulles partout pour les deux), quelle est une bonne façon de répondre à cette question?

entrez la description de l'image ici

Mettre à jour

Il semble que l'on puisse répondre à cette question de deux manières:

  1. Si nous avons des échantillons des postérieurs, nous pourrions regarder la fraction des échantillons où (ou de manière équivalente ). @ Cam.Davidson.Pilon a inclus une réponse qui résoudrait ce problème en utilisant de tels exemples.λ 2 > λ 1λ1λ2λ2>λ1

  2. Intégrer une sorte de différence des postérieurs. Et c'est une partie importante de ma question. À quoi ressemblerait cette intégration? On peut supposer que l'approche d'échantillonnage se rapprocherait de cette intégrale, mais j'aimerais connaître la formulation de cette intégrale.

Remarque: les tracés ci-dessus proviennent de ce matériau .

Amelio Vazquez-Reina
la source
Vous pouvez simplement calculer la variance des deux distributions et les ajouter. C'est la variance de la différence des moyennes. Ensuite, calculez la différence dans les moyennes et voyez combien il y a d'écarts-types. Vous pouvez approximer les deux distributions avec un début normal et utiliser les intervalles de confiance habituels pour une distribution normale. Ce sont clairement des moyens différents.
Dave31415
2
Le test d'hypothèse intrinsèque est une réponse
Stéphane Laurent
3
Tous les calculs requis sont fournis dans mon article mais je n'ai pas étudié le cas de ( ϕ est le rapport des deux taux de Poisson)H0:{ϕ=1}ϕ
Stéphane Laurent
Merci @ StéphaneLaurent. Votre article est un excellent pointeur, mais il semble être spécifique aux processus de Poisson. Quelle est la comparaison, à un niveau élevé, qu'un bayésien peut faire pour estimer si est identique ou différent de λ 1 ? L'analyse doit-elle être spécifique à la distribution? λ2λ1
Amelio Vazquez-Reina
2
Désolé @ user023472 Je n'ai pas d'énergie ces jours-ci. Voir les articles de Bernardo cités dans mon article. "Intrinsèque" signifie que la méthode est dérivée et uniquement du modèle.
Stéphane Laurent

Réponses:

6

Je pense qu'une meilleure question est, sont-ils significativement différents?

Pour répondre à cela, nous devons calculer . Appelez cette quantité p . Si p 0,50 , alors il y a une chance égale que l'un soit plus grand que l'autre. En revanche, si p est vraiment proche de 1, alors on peut être sûr que oui λ 2 est plus grand (lire: différent) que λ 1 .P(λ2>λ1)pp0,50pλ2λ1

Comment calcule-t-on ? C'est trivial dans un cadre bayésien MCMC. Nous avons des échantillons de la partie postérieure, donc calculons simplement le fait que les échantillons de λ 2 sont plus grands que λ 1 :pλ2λ1

 p = np.mean( lambda_2_samples > lambda_1_samples )
 print p

Je m'excuse de ne pas avoir inclus cela dans le livre, je vais certainement l'ajouter car je pense que c'est l'une des idées les plus utiles de l'inférence bayésienne

Cam.Davidson.Pilon
la source
5
La probabilité est de 1,0, elles sont différentes, car ce sont toutes deux des variables aléatoires continues. Considérez: quelle est votre supposition préalable que ? Pensez-vous vraiment qu'ils sont réellement égaux? (Ignorer les tests d'hypothèse: nous vivons dans le monde réel où les variables ne sont jamais réellement égales). Voir cet article de mon héros, Gelman. Calculativement, vous pouvez tester cela en calculant . λ1=λ2np.mean( lambda_2_samples != lambda_1_samples)
Cam.Davidson.Pilon
1
P(|λ1-λ2|>1)P(λ1λ2)
3
λ1λ2λ2λ1
1
oh mon dieu, je détesterais être dans cette situation! Cela implique des intégrales désagréables. Pour la plupart des modèles, vous ne pouvez pas réellement dériver les postérieurs. Même si vous le pouviez, il serait toujours préférable d'utiliser un ordinateur, juste pour obtenir des échantillons. En résumé, des exemples> des formules pour des calculs comme celui-ci.
Cam.Davidson.Pilon
2
Vous ne mesurez pas "suffisamment plus grand". Considérons une distribution avec un pic à zéro et une autre avec des masses égales aux pics -10, 10. Votre statistique - la valeur attendue de l'indicateur qu'un échantillon est plus grand que l'autre - donne 0,5, mais les distributions sont clairement totalement différentes.
Neil G
5

λ1λ2Pr(λ1=λ2)=0

λ1λ2ϵ[-ϵ/2,ϵ/2]

λ2>λ1

Sycorax dit de réintégrer Monica
la source
Merci. Comment votre réponse se rapporte-t-elle à certaines des idées discutées dans les commentaires du PO?
Amelio Vazquez-Reina
Toutes mes excuses, mais je ne connais aucune de ces méthodes, je ne peux donc pas faire de commentaire significatif. @ Stéphane_Laurent est assez intelligent, donc je recommanderais de regarder le lien, au minimum.
Sycorax dit Réintégrer Monica
1
@ user023472 Désolé, je n'ai pas l'énergie aujourd'hui pour répondre à l'approche des différences intrinsèques. Elle est basée sur la divergence Kullback-Leibler.
Stéphane Laurent
ϵp(λ2>λ1)p(λ2λ1)
Merci @ user777. Je m'intéresse au cas où nous n'avons pas accès aux échantillons. Vous aviez une intégrale dans votre message plus tôt, mais vous semblez l'avoir supprimée. À quoi ressemblerait cette intégrale?
Amelio Vazquez-Reina