Quelle est la fonction de densité de probabilité d'entropie maximale pour une variable continue positive de moyenne et d'écart type donnés?

13

Quelle est la distribution d'entropie maximale pour une variable continue positive, compte tenu de ses premier et deuxième moments?

Par exemple, une distribution gaussienne est la distribution d'entropie maximale pour une variable non bornée, compte tenu de sa moyenne et de l'écart-type, et une distribution Gamma est la distribution d'entropie maximale pour une variable positive, compte tenu de sa valeur moyenne et de la valeur moyenne de son logarithme.

Becko
la source

Réponses:

13

On peut simplement utiliser le théorème de Boltzmann qui se trouve dans l'article même de Wikipédia que vous pointez .

Notez que spécifier la moyenne et la variance équivaut à spécifier les deux premiers moments bruts - chacun détermine l'autre (il n'est pas réellement nécessaire d'invoquer cela, car nous pouvons appliquer le théorème directement à la moyenne et à la variance, c'est juste un peu plus simple de cette façon ).

Le théorème établit alors que la densité doit être de la forme:

f(x)=cexp(λ1x+λ2x2) for all x0

L'intégrabilité sur la ligne réelle positive limitera à 0 , et je pense qu'il impose certaines restrictions sur les relations entre les λ s (qui seront vraisemblablement satisfaites automatiquement en partant de la moyenne et de la variance spécifiées plutôt que des moments bruts).λ20λ

À ma grande surprise (puisque je ne m'y attendais pas quand j'ai commencé cette réponse), cela semble nous laisser avec une distribution normale tronquée.

En l'occurrence, je ne pense pas avoir utilisé ce théorème auparavant, donc des critiques ou des suggestions utiles sur tout ce que je n'ai pas considéré ou laissé de côté seraient les bienvenues.

Glen_b -Reinstate Monica
la source
+1 Merci. Semble bien. Quand j'ai lu l'article de Wikipedia, il me semble avoir raté le fait que le théorème de Boltzmann s'applique à tous les intervalles fermés. J'avais supposé qu'il ne s'appliquait qu'aux variables allant de à .
Becko
Pour une raison quelconque, la mesure de base uniforme et la distribution normale tronquée résultante ne me convainc pas complètement: comme le souligne Fred Schoen, pour trouver l'entropie maximale (relative) dans le cas continu, nous avons besoin d'une mesure de base ou d'une distribution de probabilité de référence. Étant donné que la variable continue en question est positive, il pourrait s'agir d'une variable d'échelle et une mesure de base proportionnelle à 1 / x se recommande alors pour diverses raisons (par exemple, l'invariance de groupe; voir le livre de Jaynes ou de Jeffreys). x1/x
pglpm
Avec cette mesure de base, la distribution résultante est proportionnelle à mais malheureusement, il n'est pas normalisable (il pourrait quand même être utilisé comme un mauvais préalable). Étant donné la positivité de la variable en question, il peut être utile de se demander si les moments de son logarithme peuvent avoir plus de sens en tant que porteurs d'informations et contraintes d'entropie maximale. Ils conduiraient à des distributions d'entropie maximale de type gamma.
1xexp(αxβx2)
pglpm
7

Je veux rendre la réponse de @ Glen_b plus explicite, voici une réponse supplémentaire simplement parce qu'elle ne correspondrait pas à un commentaire.

Le formalisme, etc. est bien expliqué dans les chapitres 11 et 12 du livre de Jaynes . Prendre la distribution uniforme en tant que mesure de base, la solution générale, comme @Glen_b déjà dit, est une gaussienne Pour la variable non bornée, vous pouvez résoudre explicitement pour les multiplicateurs de Lagrange λ 1 et λ 2 en termes de valeurs de contrainte ( a1 , un 2 en l'article de Wikipedia). Avec un 1 = μ , un 2 = μ 2 + σ 2

f(x)N(x|1/2λ1/λ2,1/(2λ2))
λ1λ2a1,a2a1=μ,a2=μ2+σ2 , on obtient alors , donc le gaussien N standard ( x | μ , σ 2 ) .λ1=μ/σ2,λ2=0.5σ2N(x|μ,σ2)

Pour la variable bornée , I (et mathématique) ne peut plus résoudre explicitement pour λ 1 , 2 en raison du terme de fonction d'erreur qui apparaît lors du calcul de la fonction de partition ( 1 / c dans wikipedia). Cela signifie que les paramètres μ et σ 2 du gaussien tronqué ne sont pas la moyenne et la variance de la variable continue avec laquelle vous avez commencé. Il peut même arriver que pour x m i n = 0x>xminλ1,21/cμσ2xmin=0, le mode de la gaussienne est négatif! Bien sûr, les chiffres s'accordent tous à nouveau lorsque vous prenez .xmin

Si vous avez des valeurs concrètes pour , vous pouvez toujours résoudre pour λ 1 , 2 numériquement et brancher les solutions dans l'équation générale et vous avez terminé! Les valeurs de λ 1 , 2 du cas non borné peuvent être un bon point de départ pour le solveur numérique.a1,a2λ1,2λ1,2

Cette question est un doublon de /math/598608/what-is-the-maximum-entropy-distribution-for-a-continuous-random-variable-on-0

Fred Schoen
la source