Comment le journal (p (x, y)) normalise-t-il les informations mutuelles point par point?

9

J'essaie de comprendre la forme normalisée d'informations mutuelles ponctuelles.

npmi=pmi(x,y)log(p(x,y))

Pourquoi la probabilité log-jointe normalise-t-elle les informations mutuelles ponctuelles entre [-1, 1]?

L'information mutuelle point par point est:

pmi=log(p(x,y)p(x)p(y))

p (x, y) est borné par [0, 1] donc log (p (x, y)) est borné par (, 0]. Il semble que le log (p (x, y)) devrait en quelque sorte équilibrer les changements le numérateur, mais je ne comprends pas exactement comment. Cela me rappelle aussi l'entropie , mais encore une fois je ne comprends pas la relation exacte.h=log(p(x))

2cents
la source
Pour commencer, les informations mutuelles ponctuelles utilisent un logarithme (je ne sais pas si sa faute de frappe ou si vous utilisez une autre quantité ).
Piotr Migdal

Réponses:

12

À partir de l'entrée Wikipedia sur les informations mutuelles ponctuelles :

Les informations mutuelles ponctuelles peuvent être normalisées entre [-1, + 1], ce qui donne -1 (dans la limite) pour ne jamais se produire ensemble, 0 pour l'indépendance et +1 pour une cooccurrence complète.

Pourquoi cela arrive-t-il? Eh bien, la définition de l'information mutuelle ponctuelle est

pmilog[p(x,y)p(x)p(y)]=logp(x,y)logp(x)logp(y),

alors que pour une information mutuelle normalisée ponctuelle, on entend :

npmipmilogp(x,y)=log[p(x)p(y)]logp(x,y)1.

Le quand il y a:

  • pas de co-occurrences, , donc nmpi est -1,logp(x,y)
  • co-occurrences au hasard, , donc nmpi vaut 0,logp(x,y)=log[p(x)p(y)]
  • cooccurrences complètes, , donc nmpi vaut 1.logp(x,y)=logp(x)=logp(y)
Piotr Migdal
la source
Ce serait une réponse plus complète pour montrer pourquoi npmi est sur l'intervalle . Voir ma preuve dans l'autre réponse. [1,1]
Hans
1

Bien que la réponse de Piotr Migdal soit informative en donnant les exemples où nmpi atteint trois valeurs extrêmes, cela ne prouve pas qu'il se trouve dans l'intervalle . Voici l'inégalité et sa dérivation. as pour tout événement . En divisant les deux côtés par le non négatif , nous avons [1,1]

logp(x,y)logp(x,y))logp(x)logp(y)=logp(x,y)p(x)p(y)=:pmi(x;y)=logp(y|x)+logp(y|x)logp(x,y)logp(x,y)
logp(A)0Ah(x,y):=logp(x,y)
1nmpi(x;y):=mpi(x;y)h(x,y)1.

Hans
la source