Pourquoi les gens utilisent-ils le terme «poids de la preuve» et en quoi diffère-t-il de «l'information mutuelle ponctuelle»?

11

Ici, le «poids de la preuve» (WOE) est un terme courant dans la littérature scientifique et politique publiée, le plus souvent vu dans le contexte de l'évaluation des risques, défini par:

w(e:h)=logp(e|h)p(e|h¯)

où est une évidence, est une hypothèse.heh

Maintenant, je veux savoir quelle est la principale différence avec PMI (information mutuelle ponctuelle)

pmi(e,h)=logp(e,h)p(e)p(h)
Charlie Epps
la source
Je crois que le terme a été inventé dans cet article: projecteuclid.org/…
JohnRos

Réponses:

5

Même s'ils se ressemblent, ce sont des choses très différentes. Commençons par les principales différences.

  • h est quelque chose de différent dans PMI et dans WOE Remarquez le terme dans PMI. Cela implique que est une variable aléatoire dont vous pouvez calculer la probabilité. Pour un bayésien, ce n'est pas un problème, mais si vous ne pensez pas que les hypothèses peuvent avoir une probabilité a priori, vous ne pouvez même pas écrire PMI pour les hypothèses et les preuves. Dans WOE, est un paramètre de la distribution et les expressions sont toujours définies. p ( h ) h h
    p(h)hh

  • PMI est symétrique, WOE n'est pas
    Trivialement, . Cependant, n'a pas besoin d'être défini en raison du terme . Même lorsqu'elle l'est, elle n'est généralement pas égale à .w ( h : e ) = log p ( h | e ) / p ( h | ˉ e ) ˉ e w ( e : h )pmi(e,h)=pmi(h,e)w(h:e)=logp(h|e)/p(h|e¯)e¯w(e:h)

En dehors de cela, WOE et PMI ont des similitudes.

Le poids de la preuve indique à quel point la preuve parle en faveur d'une hypothèse. S'il est égal à 0, cela signifie qu'il ne parle ni pour ni contre. Plus elle est élevée, plus elle valide l'hypothèse , et plus elle est faible, plus elle valide .ˉ hhh¯

Les informations mutuelles quantifient comment l'occurrence d'un événement ( ou ) dit quelque chose sur l'occurrence de l'autre événement. S'il vaut 0, les événements sont indépendants et l'occurrence de l'un ne dit rien de l'autre. Plus il est élevé, plus ils se produisent souvent, et plus il est faible, plus ils s'excluent mutuellement.heh

Qu'en est-il des cas où l'hypothèse est également une variable aléatoire et les deux options sont valides? Par exemple, dans la communication sur un canal binaire bruyant, l'hypothèse est le signal émis à décoder et la preuve est le signal reçu. Disons que la probabilité de retournement est de , donc si vous recevez un , le WOE pour est . Le PMI, en revanche, dépend de la proactivité de l'émission d'un . Vous pouvez vérifier que lorsque la probabilité d'émettre un tend vers 0, le PMI tend vers , alors qu'il tend vers lorsque la probabilité d'émettre unh 1 / une mille 1 1 log 0,999 / 0,001 = 6,90 1 1 6,90 0 1 1hh1/100011log0.999/0.001=6.90116.9001 tend à .1

Ce comportement paradoxal illustre deux choses:

  1. Aucun d'entre eux ne permet de deviner l'émission. Si la probabilité d'émettre un tombe en dessous de , l'émission la plus probable est même lors de la réception d'un . Cependant, pour les faibles probabilités d'émettre un WOE et PMI sont proches de .1 / mille 0 1 1 6,9011/10000116.90

  2. Le PMI est un gain d'informations (de Shannon) sur la réalisation de l'hypothèse, si l'hypothèse est presque sûre, aucune information n'est acquise. WOE est une mise à jour de nos cotes antérieures , qui ne dépend pas de la valeur de ces cotes.

gui11aume
la source
Cela peut être une notion, mais dans WMI, comment définissez-vous sans définir ? N'allez-vous pas avec ? p ( h ) p ( e | h ) = p ( e , h )p(e|h)p(h)p(e|h)=p(e,h)p(h)
Mike Battaglia
1
Je suppose que tu veux dire WOE. Considérez comme un paramètre de distribution, une distribution de Poisson par exemple. Dans ce cas, est juste la vraisemblance et vous n'avez pas besoin de définir . En fait, vous n'avez pas besoin de croire que cela a un sens. p ( e | h ) p ( h )hp(e|h)p(h)
gui11aume