Je vais utiliser la divergence KL dans mon code python et j'ai eu ce tutoriel .
Sur ce tutoriel, implémenter la divergence KL est assez simple.
kl = (model * np.log(model/actual)).sum()
Si je comprends bien, la distribution de probabilité de model
et actual
devrait être <= 1.
Ma question est, quelle est la valeur maximale liée / maximale possible de k ?. J'ai besoin de connaître la valeur maximale possible de la distance kl comme pour la limite maximale dans mon code.
machine-learning
distance
kullback-leibler
user46543
la source
la source
Réponses:
Ou même avec le même support, quand une distribution a une queue beaucoup plus grosse que l'autre. Soit
la source
Pour les distributions qui n'ont pas le même support, la divergence KL n'est pas limitée. Regardez la définition:
si P et Q n'ont pas le même support, il existe un point où p ( x ′ ) ≠ 0 et q ( x ′ ) = 0 , faisant passer KL à l'infini. Ceci s'applique également aux distributions discrètes, ce qui est votre cas.x′ p(x′)≠0 q(x′)=0
Edit: Peut-être un meilleur choix pour mesurer la divergence entre les distributions de probabilité serait la distance dite de Wasserstein qui est une métrique et a de meilleures propriétés que la divergence KL. Il est devenu très populaire en raison de ses applications dans le deep-learning (voir réseaux WGAN)
la source
Pour ajouter aux excellentes réponses de Carlos et Xi'an , il est également intéressant de noter qu'une condition suffisante pour que la divergence KL soit finie est que les deux variables aléatoires aient le même support compact et que la densité de référence soit limitée . Ce résultat établit également une borne implicite pour le maximum de la divergence KL (voir théorème et preuve ci-dessous).
Théorème: Si les densités et q ont le même support compact X et que la densité p est bornée sur ce support (c'est-à-dire qu'elle a une borne supérieure finie) alors K L ( P | | Q ) < ∞ .p q X p KL(P||Q)<∞
Preuve: Puisque a un support compact X, cela signifie qu'il existe une valeur infimum positive:q X
De même, puisque a un support compact X, cela signifie qu'il existe une valeur de supremum positive:p X
De plus, comme ce sont les deux densités sur le même support, et que ce dernier est borné, on a . Cela signifie que:0<q–⩽p¯<∞
Maintenant, en laissant la dernière borne supérieure, nous avons clairement 0 ⩽ L _ < ∞ de sorte que:L––≡ln(p¯)−ln(q–) 0⩽L––<∞
la source