Log probabilite vs produit des probabilités

17

Selon cet article de wikipedia , on peut représenter le produit des probabilités x⋅ycomme -log(x) - log(y)rendant le calcul plus optimal en termes de calcul. Mais si j'essaie un exemple, dites:

p1 = 0.5
p2 = 0.5
p1 * p2 = 0.25
-log(p1) - log(p2) = 2

p3 = 0.1
p4 = 0.1
p3 * p4 = 0.01
-log(p3) - log(p4) = 6.64

Le produit des probabilités p1et p2est supérieur à celui de p3et p4, mais la probabilité logarithmique est inférieure.

Comment venir?

spacemonkey
la source
2
Qu'est-ce qui ne va pas? Probabilités plus petites vont donner des valeurs plus élevées parce que augmente de 0 lorsque p = 1 vers comme p 0 . logp0p=1p0
Dilip Sarwate
5
(+1) Pourquoi downvote? Je pense que c'est une question sur le sujet bien écrite, quoique très élémentaire.
Juho Kokkala
@DilipSarwate mon problème n'est pas avec la partie mathématique, mais avec cette façon particulière de représenter les probabilités. Il s'agit peut-être simplement de se familiariser avec cela.
spacemonkey

Réponses:

22

Je crains que vous n'ayez mal compris l'objectif de l'article. Ce n'est pas une grande surprise, car il est quelque peu écrit de manière peu claire. Il se passe deux choses différentes.

La première consiste simplement à travailler sur l'échelle logarithmique.

C'est-à-dire qu'au lieu de " " (quand vous avez l'indépendance), on peut plutôt écrire " log ( p A B ) = log ( p A ) + log ( p B ) ". Si vous avez besoin de la probabilité réelle, vous pouvez exponentiellement à la fin pour récupérer p A B :pAB=pApBlog(pAB)=log(pA)+log(pB)pAB mais si nécessaire, l'exponentiation serait normalement laissée à la dernière étape possible. Jusqu'ici tout va bien.pAB=elog(pA)+log(pB),

La deuxième partie remplace par - log p . C'est ainsi que nous travaillons avec des valeurs positives.logplogp

Personnellement, je n'y vois pas vraiment de valeur, d'autant plus qu'il inverse la direction de tout ordre ( est monotone croissant, donc si p 1 < p 2 , alors log ( p A ) < log ( p 2 ) ; ce l'ordre est inversé avec - log p ).logp1<p2log(pA)<log(p2)logp

logp

si=log(pi)spAB=e[sA+sB].

Glen_b -Reinstate Monica
la source
2
+1 "Considérez la probabilité du journal négatif comme une échelle de" rareté "- plus le nombre est élevé, plus l'événement est rare"
Zhubarb