Gamma vs distributions log-normales

29

J'ai une distribution observée expérimentalement qui ressemble beaucoup à une distribution gamma ou lognormale. J'ai lu que la distribution lognormale est la distribution de probabilité d'entropie maximale pour une variable aléatoire pour laquelle la moyenne et la variance de ln ( X ) sont fixes. La distribution gamma a-t-elle des propriétés similaires?Xln(X)

OSE
la source
2
Pourquoi une telle propriété serait-elle utile pour décider quel serait le modèle approprié?
Glen_b -Reinstate Monica
@Glen_b Je suis toujours un débutant en matière de statistiques, donc mes connaissances sont assez basiques. En regardant les graphiques des distributions gamma et lognormales, qualitativement, ils se ressemblent beaucoup. Je recherche des différences quantitatives entre les deux. Par exemple, quels sont quelques exemples d'applications physiques où des distributions gamma ou log-normales se produisent?
OSE
En réalité, ni l'un ni l'autre ne se produit jamais; ce sont des modèles extraordinairement simples qui sont parfois des approximations utiles (mais grossières) de la réalité. Je posterai une réponse qui discute de certaines différences qualitatives.
Glen_b -Reinstate Monica
1
@glen_b: la raison en est que si vous ne mesurez que ces statistiques, la distribution hypothétique minimale est uniquement la distribution de la famille exponentielle avec ces statistiques suffisantes. Alors que toute distribution peut être un mauvais modèle de réalité, si l'on n'est pas libre de choisir les mesures à prendre, c'est une excellente façon de choisir un modèle.
Neil G
1
@Glen_b Je suppose que la distribution lognormale devrait apparaître dans certaines situations physiques à cause du CLT.
Stéphane Laurent

Réponses:

27

Quant aux différences qualitatives, le log-normal et le gamma sont, comme vous le dites, assez similaires.

En effet, en pratique, ils sont souvent utilisés pour modéliser les mêmes phénomènes (certaines personnes utiliseront un gamma alors que d'autres utiliseront un log-normal). Ce sont tous les deux, par exemple, des modèles à coefficient de variation constant (le CV pour le log-normal est , pour le gamma c'est1/eσ2-1 ).1/α

[Comment peut-il être constant s'il dépend d'un paramètre, demandez-vous? Il s'applique lorsque vous modélisez l'échelle (emplacement de l'échelle logarithmique); pour le lognormal, agit comme un paramètre d'échelle, tandis que pour le gamma, l'échelle est le paramètre qui n'est pas le paramètre de forme (ou sa réciproque si vous utilisez le paramétrage du taux de forme). J'appellerai le paramètre d'échelle pour la distribution gamma β . Les GLM gamma modélisent la moyenne ( μ = α β ) tout en maintenant α constant; dans ce cas, μ est également un paramètre d'échelle. Un modèle avec respectivement μ et α ou σ constant aura un CV constant.]μβμ=αβαμμασ

Vous pourriez trouver instructif de regarder la densité de leurs journaux , qui montre souvent une différence très claire.

Le log d'une variable aléatoire lognormale est ... normal. C'est symétrique.

Le log d'une variable aléatoire gamma est de gauche. Selon la valeur du paramètre de forme, il peut être assez asymétrique ou presque symétrique.

Voici un exemple, avec lognormal et gamma ayant une moyenne de 1 et une variance de 1/4. Le graphique du haut montre les densités (gamma en vert, log-normal en bleu), et celui du bas montre les densités des journaux:

gamma et lognormal, densité et densité de log

(Tracer le journal de la densité des journaux est également utile. C'est-à-dire, prendre une échelle logarithmique sur l'axe des y ci-dessus)

CV3+3CV2CV

Glen_b -Reinstate Monica
la source
+1. Savez-vous s'il existe une formule fermée pour l'asymétrie du log de gamma? Pour lognormal, l'asymétrie de log est clairement nulle, et je me demande s'il existe une expression pour le gamma. Wikipedia donne des formules pour la moyenne et la variance du log (gamma), mais pas pour l'asymétrie.
amibe dit Réintégrer Monica
0xν1eμx(lnx)pdxp=2,3,4p=1Γ,ψζpcomme dérivé d'une fonction gamma, il est donc vraisemblablement possible d'aller plus haut. Donc l'asymétrie est certainement faisable mais pas spécialement "soignée". Si vous voulez poursuivre, je pourrais vous donner les intégrales.
Glen_b -Reinstate Monica
Cependant, nous n'avons pas besoin d'évaluer l'asymétrie pour discerner son signe. L'examen du journal de la densité des journaux devrait suffire à établir cela parce qu'un côté domine clairement l'autre.
Glen_b -Reinstate Monica
Merci Glen. J'ai décidé de le poster comme une nouvelle question: stats.stackexchange.com/questions/312803 . J'ai passé un peu de temps à chercher une réponse prête, mais je n'ai pas pu en trouver, il pourrait donc être utile pour l'avenir de l'écrire quelque part où elle est facile à trouver. Cela pourrait être un peu mieux adapté à Math.SE, mais je préférerais l'avoir ici, pour être honnête.
amibe dit Réintégrer Monica
11

E(X)E(logX)

Pour répondre à votre question sur les processus physiques qui génèrent ces distributions: La distribution lognormale se produit lorsque le logarithme de X est normalement distribué, par exemple, si X est le produit de très nombreux petits facteurs. Si X est distribué gamma, c'est la somme de nombreuses variables distribuées de façon exponentielle. Par exemple, le temps d'attente pour de nombreux événements d'un processus de Poisson.

Neil G
la source
5
Pas besoin de "nombreuses" variables exponentielles pour être Gamma.
Stéphane Laurent