La relation entre la distribution gamma et la distribution normale

26

J'ai récemment trouvé nécessaire de dériver un pdf pour le carré d'une variable aléatoire normale avec une moyenne de 0. Pour une raison quelconque, j'ai choisi de ne pas normaliser la variance au préalable. Si je l'ai fait correctement, ce pdf est le suivant:

N2(x;σ2)=1σ2πxex2σ2

J'ai remarqué que ce n'était en fait qu'une paramétrisation d'une distribution gamma:

N2(x;σ2)=Gamma(x;12,2σ2)

Et puis, du fait que la somme de deux gammas (avec le même paramètre d'échelle) est égale à un autre gamma, il s'ensuit que le gamma est équivalent à la somme de variables aléatoires normales au carré.k

NΣ2(x;k,σ2)=Gamma(x;k2,2σ2)

C'était un peu surprenant pour moi. Même si je savais que la - une distribution de la somme des VR normaux au carré standard - était un cas spécial du gamma, je ne savais pas que le gamma était essentiellement juste une généralisation permettant la somme de la normale variables aléatoires de toute variance. Cela conduit également à d'autres caractérisations que je n'avais pas rencontrées auparavant, telles que la distribution exponentielle étant équivalente à la somme de deux distributions normales au carré.χ2

Tout cela est quelque peu mystérieux pour moi. La distribution normale est-elle fondamentale pour la dérivation de la distribution gamma, de la manière décrite ci-dessus? La plupart des ressources que j'ai vérifiées ne mentionnent pas que les deux distributions sont intrinsèquement liées comme ça, ou même d'ailleurs décrivent comment le gamma est dérivé. Cela me fait penser qu'une vérité de niveau inférieur est en jeu que j'ai simplement mise en évidence de manière alambiquée?

timxyz
la source
6
De nombreux manuels de premier cycle sur la théorie des probabilités mentionnent tous les résultats ci-dessus; mais peut-être que les textes statistiques ne couvrent pas ces idées? Dans tous les cas, une variable aléatoire est juste où est une variable aléatoire normale standard, et donc (pour les variables iid) est simplement une variable aléatoire mise à l'échelle n'est pas surprenant pour ceux qui ont étudié la théorie des probabilités. Y i σ X i X i i Y 2 i = σ 2 i X 2 i χ 2N(0,σ2)YiσXiXiiYi2=σ2iXi2 χ2
Dilip Sarwate
Je suis issu de la vision par ordinateur, donc je ne rencontre pas normalement la théorie des probabilités. Aucun de mes manuels (ou Wikipedia) ne mentionne cette interprétation. Je suppose que je demande aussi, quelle est la particularité de la somme du carré de deux distributions normales qui en fait un bon modèle pour le temps d'attente (c'est-à-dire la distribution exponentielle). J'ai toujours l'impression de manquer quelque chose de plus profond.
timxyz
3
Étant donné que Wikipedia définit la distribution du chi carré comme une somme des normales au carré sur en.wikipedia.org/wiki/Chi-squared_distribution#Definition et mentionne que le chi carré est un cas spécial du Gamma (sur en.wikipedia.org/wiki / Gamma_distribution # Others ), on peut difficilement affirmer que ces relations ne sont pas bien connues. La variance elle-même établit simplement l'unité de mesure (un paramètre d'échelle) dans tous les cas et n'introduit donc aucune complication supplémentaire.
whuber
3
Bien que ces résultats soient bien connus dans le domaine des probabilités et des statistiques, bravo @timxyz pour les avoir redécouverts dans votre propre analyse.
Rétablir Monica le
La connexion n'est pas mystérieuse, c'est parce qu'ils sont membres de la famille exponentielle des distributions dont la propriété saillante est qu'elles peuvent être atteintes par substitution de variables et / ou de paramètres. Voir la réponse plus longue ci-dessous avec des exemples.
Carl

Réponses:

18

Comme l'a noté le commentaire du professeur Sarwate, les relations entre la normale au carré et le chi carré sont un fait très largement diffusé - car il devrait également être le fait qu'un chi carré n'est qu'un cas particulier de la distribution Gamma:

XN(0,σ2)X2/σ2χ12X2σ2χ12=Gamma(12,2σ2)

la dernière égalité résultant de la propriété de mise à l'échelle du Gamma.

En ce qui concerne la relation avec l'exponentielle, pour être précis, c'est la somme de deux normales de moyenne nulle au carré, chacune mise à l'échelle par la variance de l'autre , qui conduit à la distribution exponentielle:

X1N(0,σ12),X2N(0,σ22)X12σ12+X22σ22χ22σ22X12+σ12X22σ12σ22χ22

σ22X12+σ12X22σ12σ22χ22=Gamma(1,2σ12σ22)=Exp(12σ12σ22)

Mais le soupçon qu'il y a "quelque chose de spécial" ou de "plus profond" dans la somme de deux normales moyennes au carré zéro qui "en fait un bon modèle pour le temps d'attente" n'est pas fondé: tout d'abord, ce qui est spécial au sujet de la distribution exponentielle qui fait -ce un bon modèle pour le "temps d'attente"? L'absence de mémoire bien sûr, mais y a-t-il quelque chose de "plus profond" ici, ou simplement la forme fonctionnelle simple de la fonction de distribution exponentielle, et les propriétés de ? Les propriétés uniques sont éparpillées partout dans les mathématiques, et la plupart du temps, elles ne reflètent pas une "intuition plus profonde" ou une "structure" - elles existent simplement (heureusement).e

Deuxièmement, le carré d'une variable a très peu de relation avec son niveau. Considérez simplement in, disons, :[ - 2 ,f(x)=x[2,2]

entrez la description de l'image ici

... ou représenter graphiquement la densité normale standard par rapport à la densité du chi carré: ils reflètent et représentent des comportements stochastiques totalement différents, même s'ils sont si intimement liés, car le second est la densité d'une variable qui est le carré du premier. La normale peut être un pilier très important du système mathématique que nous avons développé pour modéliser le comportement stochastique - mais une fois que vous l'ajustez, cela devient quelque chose de totalement différent.

Alecos Papadopoulos
la source
Merci d'avoir répondu en particulier aux questions de mon dernier paragraphe.
timxyz
2
De rien. Je dois admettre que je suis heureux que ma réponse ait atteint le PO d'origine 26 mois après la publication de la question.
Alecos Papadopoulos
11

Abordons la question posée: tout cela est quelque peu mystérieux pour moi. La distribution normale est-elle fondamentale pour la dérivation de la distribution gamma ...? Pas de mystère vraiment, c'est simplement que la distribution normale et la distribution gamma sont membres, entre autres de la famille exponentielle de distributions, laquelle famille est définie par la capacité de convertir entre des formes équationnelles par substitution de paramètres et / ou de variables. En conséquence, il existe de nombreuses conversions par substitution entre distributions, dont quelques - unes sont résumées dans la figure ci-dessous.

entrez la description de l'image iciLEEMIS, Lawrence M .; Jacquelyn T. MCQUESTON (février 2008). "Relations de distribution univariées" (PDF). Statisticien américain. 62 (1): 45-53. doi: 10.1198 / 000313008x270448 citer

Voici deux relations de distribution normale et gamma plus en détail (parmi un nombre inconnu d'autres, comme via le chi carré et la bêta).

Premièrement, une relation plus directe entre la distribution gamma (GD) et la distribution normale (ND) avec zéro moyen suit. Autrement dit, le GD prend une forme normale car son paramètre de forme peut augmenter. Il est plus difficile de prouver que tel est le cas. Pour le GD,

GD(z;a,b)={baza1ezbΓ(a)z>00other.

Comme le paramètre de forme GD , la forme GD devient plus symétrique et normale, cependant, comme la moyenne augmente avec l'augmentation de , nous devons déplacer le GD de gauche de pour le maintenir stationnaire, et enfin, si nous souhaitons conserver le même écart-type pour notre GD décalé, nous devons diminuer le paramètre d'échelle ( ) proportionnel à .aa(a1)1akb1a

A savoir, pour transformer un GD en un cas limite ND, nous définissons l'écart type comme une constante ( ) en laissant et en déplaçant le GD vers la gauche pour avoir un mode de zéro en substituantEnsuitekb=1akz=(a1)1ak+x .

GD((a1)1ak+x; a, 1ak)={(ka)aeaxka+1((a1)ka+x)a1Γ(a)x>k(1a)a0other.

Notez que dans la limite en tant la valeur la plus négative de pour laquelle ce GD est différent de zéro . Autrement dit, le support GD semi-infini devient infini . En prenant la limite comme du GD reparameterized, nous trouvonsaxa

lima(ka)aeaxka+1((a1)ka+x)a1Γ(a)=ex22k22πk=ND(x;0,k2)

Graphiquement pour et le GD est en bleu et le limitant est en orange, en dessousk=2a=1,2,4,8,16,32,64ND(x;0, 22)

entrez la description de l'image ici

Deuxièmement, soulignons qu'en raison de la similitude de forme entre ces distributions, on peut à peu près développer des relations entre le gamma et les distributions normales en les tirant hors de l'air. A savoir, nous développons ensuite une généralisation de la distribution gamma "dépliée" d'une distribution normale.

Notez d'abord que c'est le support semi-infini de la distribution gamma qui entrave une relation plus directe avec la distribution normale. Cependant, cet obstacle peut être supprimé en considérant la distribution semi-normale, qui a également un support semi-infini. Ainsi, on peut généraliser la distribution normale (ND) en la pliant d'abord pour qu'elle soit semi-normale (HND), en la reliant à la distribution gamma généralisée (GD), puis pour notre tour de force, on "déplie" les deux (HND et GD) pour faire ainsi un ND généralisé (un GND).

La distribution gamma généralisée

GD(x;α,β,γ,μ)={γe(xμβ)γ(xμβ)αγ1βΓ(α)x>μ0other,

Peut être reparamétrisé pour être la distribution semi-normale ,

GD(x;12,πθ,2,0)={2θeθ2x2ππx>00other=HND(x;θ)

Notez queAinsi,θ=πσ2.

ND(x;0,σ2)=12HND(x;θ)+12HND(x;θ)=12GD(x;12,πθ,2,0)+12GD(x;12,πθ,2,0),

ce qui implique que

GND(x;μ,α,β)=12GD(x;1β,α,β,μ)+12GD(x;1β,α,β,μ)=βe(|xμ|α)β2αΓ(1β),

est une généralisation de la distribution normale, où est l'emplacement, est l'échelle et est la forme et où donne une distribution normale. Il inclut la distribution de Laplace lorsque . Comme , la densité converge ponctuellement vers une densité uniforme sur . Vous trouverez ci-dessous la distribution normale généralisée tracée pour en bleu avec le cas normal en orange.μα>0β>0β=2β=1β(μα,μ+α)α=π2,β=1/2,1,4α=π2,β=2

entrez la description de l'image ici

Ce qui précède peut être considéré comme la distribution normale généralisée version 1 et dans différentes paramétrisations est connue comme la distribution de puissance exponentielle et la distribution d'erreur généralisée, qui sont à leur tour l'une des nombreuses autres distributions normales généralisées .

Carl
la source
2

La dérivation de la distribution chi carré de la distribution normale est très analogue à la dérivation de la distribution gamma de la distribution exponentielle.

Nous devrions pouvoir généraliser ceci:

  • Si les sont des variables indépendantes d'une distribution normale généralisée avec un coefficient de puissance alors peut être lié à une distribution chi carré à l'échelle (avec des "degrés de liberté" égaux à ).XimY=inXimn/m

L'analogie est la suivante:

Les distributions normale et khi carré se rapportent à la somme des carrés

  • La distribution de densité conjointe de plusieurs variables distribuées normales standard indépendantes dépend dexi2
    f(x1,x2,...,xn)=exp(0.5i=1nxi2)(2π)n/2

  • SiXiN(0,1)

    alorsi=1nXi2χ2(ν)

Les distributions exponentielles et gamma se rapportent à la somme régulière

  • La distribution de densité conjointe de plusieurs variables distribuées exponentielles indépendantes dépend de xi

    f(x1,x2,...,xn)=exp(λi=1nxi)λn

  • SiXiExp(λ)

    alorsi=1nXiGamma(n,λ)


La dérivation peut être effectuée par un changement de variables intégrant non pas sur tous les mais plutôt sur le terme sommé (c'est ce que Pearson a fait en 1900). Cela se déroule de manière très similaire dans les deux cas.x1,x2,...xn

Pour la :χ2

fχ2(n)(s)ds=es/2(2π)n/2dVdsds=es/2(2π)n/2πn/2Γ(n/2)sn/21ds=12n/2Γ(n/2)sn/21es/2ds

Où est le volume à n dimensions d'une n-boule de rayon carré .V(s)=πn/2Γ(n/2+1)sn/2s

Pour la distribution gamma:

fG(n,λ)(s)ds=eλsλndVdsds=eλsλnnsn1n!ds=λnΓ(n)sn1eλsds

Où Est le volume à n dimensions d'un n-polytope avec .xi<sV(s)=snn!xi<s


La distribution gamma peut être considérée comme le temps d'attente pour le ème événement dans un processus de Poisson qui est distribué comme la somme de variables distribuées exponentiellement.n nYnn

Comme Alecos Papadopoulos l'a déjà noté, il n'y a pas de connexion plus profonde qui fait des sommes de variables normales au carré «un bon modèle pour le temps d'attente». La distribution gamma est la distribution d'une somme de variables distribuées normales généralisées. Voilà comment les deux se rejoignent.

Mais le type de somme et le type de variables peuvent être différents. Alors que la distribution gamma, lorsqu'elle est dérivée de la distribution exponentielle (p = 1), obtient l'interprétation de la distribution exponentielle (temps d'attente), vous ne pouvez pas revenir en arrière et revenir à une somme de variables gaussiennes au carré et utiliser cette même interprétation.

La distribution de densité pour le temps d'attente qui diminue de façon exponentielle, et la distribution de densité pour une erreur gaussienne diminue de manière exponentielle (avec un carré). C'est une autre façon de voir les deux connectés.

Sextus Empiricus
la source