Si est une distribution de probabilité avec des valeurs non nulles sur , pour quel (s) type (s) de existe-t-il une constante telle que pour tout?
L'inégalité ci-dessus est en fait une divergence de Kullback-Leibler entre la distribution et une version compressée de celle-ci . J'ai découvert que cette inégalité vaut pour les distributions exponentielles, gamma et Weibull et je suis intéressé de savoir si cela fonctionne pour une plus grande classe de distributions de probabilité.
Une idée de ce que signifie cette inégalité?
Réponses:
Préliminaires
Écrire
Les logarithmes et la relation entre et suggèrent d'exprimer à la fois et son argument sous forme d'exponentielles. À cette fin, définissezp ( x ( 1 +p(x) pp(x(1+ϵ)) p
pour tout réel pour lequel le côté droit est défini et égal à où . Notez que le changement de variables entraîne et (en prenant pour la densité d'une distribution) que la loi de probabilité totale peut ainsi être exprimée comme- ∞ p ( e y ) = 0 x = ey −∞ p(ey)=0 d x = e y d y px=ey dx=eydy p
Supposons que lorsque . y → ± ∞eq(y)+y→0 y→±∞ Cela exclut les distributions de probabilité avec une infinité de pics de densité près de ou . En particulier, si les queues de sont finalement monotones, implique cette hypothèse, montrant qu'elle n'est pas grave.p ∞ p0 ∞ p (1)
Pour faciliter le travail avec les logarithmes, notez également que
Étant donné que les calculs suivants seront effectués jusqu'à des multiples de , définissezϵ2
On pourrait aussi bien remplacer par , avec correspondant à et positif correspondant à positif .e δ δ = 0 ϵ = 0 δ ϵ1+ϵ eδ δ=0 ϵ=0 δ ϵ
Une analyse
Une manière évidente de faire échouer l'inégalité serait que l'intégrale diverge pour certains . Cela se produirait si, par exemple, il devait y avoir tout intervalle approprié de nombres positifs, aussi petit soit-il, dans lequel était identique à zéro mais n'était pas nul sur l'intervalle . Cela ferait que l'intégrande soit infini avec probabilité positive.ϵ∈(0,1][u,v]pp[u-ϵ,v-ϵ]Ip(ϵ) ϵ∈(0,1] [u,v] p p [u−ϵ,v−ϵ]
Parce que la question n'est pas spécifique concernant la nature de , nous pourrions nous enliser dans des problèmes techniques concernant la fluidité de . Evitons de tels problèmes, en espérant tout de même avoir un aperçu, en supposant que partout a autant de dérivés que nous pourrions utiliser. (Deux suffiront si est continu.) Parce que cela garantit que reste borné sur tout ensemble borné, cela implique que n'est jamais nul lorsque .p q q ′ ′ q p ( x ) x > 0p p q q′′ q p(x) x>0
Notez que la question concerne vraiment le comportement de lorsque rapproche de zéro par le haut. Puisque cette intégrale est une fonction continue de dans l'intervalle , elle atteint un maximum de lorsque est limité à tout intervalle positif , nous permettant de choisir , car évidemmentϵϵ(0,1] M p (a)ϵ[a,1]c= M p (a) / a 2Ip(ϵ) ϵ ϵ (0,1] Mp(a) ϵ [a,1] c=Mp(a)/a2
fait fonctionner l'inégalité. C'est pourquoi nous n'avons qu'à nous préoccuper du calcul modulo .ϵ2
Solution
En utilisant les changements de variable de à , de à et de à , calculons par le second ordre dans (ou ) dans l'espoir de réaliser une simplification. À cette fin, définiry p q ϵ δ I p ( ϵ ) ϵx y p q ϵ δ Ip(ϵ) ϵ δ
être le reste d'ordre dans l'expansion de Taylor de autour de .q2 q y
Changer les variables en dans l'intégrale de gauche montre qu'il doit disparaître, comme le fait l'hypothèse suivante . Changer les variables de retour à dans l'intégrale de droite donne(q(y)+y x = e(1) x=ey
L'inégalité se maintient (selon nos différentes hypothèses techniques) si et seulement si le coefficient de à droite est fini.δ2
Interprétation
C'est un bon point d'arrêt, car il semble découvrir le problème essentiel: est délimité par une fonction quadratique de précisément lorsque l'erreur quadratique dans l'expansion de Taylor de ne se produit pas. exploser ( par rapport à la distribution) comme approches .ϵqIp(ϵ) ϵ q ± ∞y ±∞
Vérifions quelques-uns des cas mentionnés dans la question: les distributions exponentielles et gamma. (L'exponentielle est un cas particulier du gamma.) Nous n'avons jamais à nous soucier des paramètres d'échelle, car ils changent simplement les unités de mesure. Seuls les paramètres non à l'échelle comptent.
Ici, parce que pour , L'extension de Taylor autour d'un arbitraire estLe théorème de Taylor avec reste implique que est dominé par pour un suffisamment petit . Étant donné que l'espérance de est finie, l'inégalité s'applique aux distributions gamma. k > - 1 q ( y ) = - e y + k y - log Γ ( k + 1 ) . y Constante + ( k -p(x)=xke−x k>−1
Des calculs similaires impliquent l'inégalité des distributions Weibull, les distributions demi-normales, les distributions lognormales, etc. En fait, pour obtenir que nous aurions besoin des contre de violer au moins une hypothèse, nous forçant à regarder les distributions où est nulle sur un intervalle ou est pas différenciable en continu deux fois, ou possède une infinité de modes. Ce sont des tests faciles à appliquer à n'importe quelle famille de distributions couramment utilisées dans la modélisation statistique.p
la source