La fonction delta de Dirac doit-elle être considérée comme une sous-classe de la distribution gaussienne?

10

Dans Wikidata, il est possible de lier des distributions de probabilité (comme tout le reste) dans une ontologie, par exemple, que la distribution t est une sous-classe de la distribution t non centrale, voir, par exemple,

https://angryloki.github.io/wikidata-graph-builder/?property=P279&item=Q209675&iterations=3&limit=3

Il existe différents cas limites, par exemple, lorsque les degrés de liberté dans la distribution t vont à l'infini ou lorsque la variance s'approche de zéro pour la distribution normale (distribution gaussienne). Dans ce dernier cas, la distribution ira vers la fonction delta de Dirac.

Je note que sur Wikipedia anglais, le paramètre de variance est actuellement déclaré comme supérieur à zéro, donc avec une interprétation stricte, on ne dirait pas que la fonction delta de Dirac est une sous-classe de la distribution normale. Cependant, cela me semble tout à fait correct, car je dirais que la distribution exponentielle est une superclasse de la fonction delta de Dirac.

Y a-t-il des problèmes à affirmer que la fonction delta de Dirac est une sous-classe de la distribution gaussienne?

Finn Årup Nielsen
la source
1
SI le delta du dirac est une sous-classe de gaussien, alors son kurtosis doit être de 3, non?
Aksakal
Je suppose que si nous considérons le delta de Dirac comme une sous-classe de plusieurs distributions de probabilité, alors le kurtosis est incohérent pour le delta de Dirac. Cela dénonce le fait de considérer le delta de Dirac comme une sous-classe de l'une de ces distributions.
Finn Årup Nielsen,
Dans le contexte de probabilité, le delta est décrit comme une fonction généralisée. Ce n'est pas une fonction ordinaire
Aksakal

Réponses:

10

Le delta de Dirac est considéré comme une distribution gaussienne quand cela est commode de le faire, et pas ainsi quand ce point de vue nous oblige à faire des exceptions.

Par exemple, jouiraient d'une distribution gaussienne multivariée si i a i X i est une variable aléatoire gaussienne pour tous les choix de nombres réels a 1 , a 2 , , a n . (Remarque: il s'agit d'une définition standard dans les statistiques "avancées"). Puisqu'un choix est a 1 = a 2 = =(X1,X2,,Xn)iaiXia1,a2,,an , la définition standard traite la constante 0 (une variable aléatoire dégénérée) comme une variable aléatoire gaussienne (avec moyenne et variance 0 ). D'un autre côté, nous ignorons notre considération pour le delta de Dirac comme une distribution gaussienne lorsque nous envisageons quelque chose commea1=a2==an=000

"La fonction de distribution de probabilité cumulative (CDF) d'une variable aléatoire gaussienne à moyenne nulle avec écart-type est F X ( x ) = P { X x } = Φ ( xσΦ()est le CDF d'une variable aléatoire gaussienne standard. "

FX(x)=P{Xx}=Φ(xσ)
Φ()

01x0

limσ0Φ(xσ)={0,x<0,12,x=0,1,x>0.
Mais, beaucoup de gens vous diront que considérer un delta de Dirac comme une distribution gaussienne est un non-sens car leur livre dit que la variance d'une variable aléatoire gaussienne doit être un nombre positif (et certains d'entre eux voteront à la baisse cette réponse pour montrer leur mécontentement). Il y a quelques années, il y a eu une discussion très vigoureuse et éclairante sur ce point sur stats.SE mais malheureusement, ce n'était que dans les commentaires sur une réponse (par @Macro, je crois) et pas en tant que réponses individuelles, et je ne peux pas le retrouver .
Dilip Sarwate
la source
3
+1. Je ne suis pas sûr qu'il y ait un problème concernant le CDF, car je pense que la valeur limite d'une séquence de CDF à n'importe quel saut de la limite n'a pas d'importance. Il y a deux façons de voir cela. La première consiste à noter que votre formule de limitation n'est pas un CDF valide (ce n'est pas cadlag). Une autre consiste à noter que vous obtenez une distribution Dirac à lorsque vous laissez simultanément, mais vous pouvez essayer d'avoir la valeur limite de être n'importe quoi entre et (ou ne pas avoir de limite du tout). ( μ , σ ) ( 0 , 0 ) Φ μ , σ ( 0 ) 0 10(μ,σ)(0,0)Φμ,σ(0)01
whuber
6
La conversation à laquelle vous faites référence s'est produite dans les commentaires de cette réponse , bien que j'espère sincèrement que pour la plupart des lecteurs, la discussion ne semblera pas trop vigoureuse. (+1)
Cardinal
1
@cardinal Connaissance approfondie de notre communauté. Bien joué!
Matthew Drury
10

Les fonctions delta s'inscrivent dans une théorie mathématique des distributions (qui est assez distincte de la théorie des distributions de probabilités , la terminologie ne pourrait pas être plus confuse ici).

Essentiellement, les distributions sont des fonctions généralisées. Ils ne peuvent pas être évalués comme une fonction, mais peuvent ensuite être intégrés. Plus précisément, une distribution est définie comme suitD

Soit l'ensemble des fonctions de test . Une fonction de test est une fonction vraie, honnête à Dieu, lisse, avec un support compact. Une distribution est un mappage linéaireθ D : T RTθD:TR

Une fonction honnête détermine une distribution par l'opérateur d'intégrationf

T(θ)=+f(x)θ(x)dx

Il y a des distributions qui ne sont pas associées à de vraies fonctions, l'opérateur dirac en fait partie

δ(θ)=θ(0)

Nttθ

θ(0)=limt0+Nt(x)θ(x)dx

Ceci est probablement plus communément exprimé comme

θ(0)=+δ(x)θ(x)dx=limt0+Nt(x)θ(x)dx

δ(x)

Bien sûr, savoir si cela fait du dirac un membre de la famille des distributions normales est une question culturelle. Ici, je donne juste une raison pour laquelle il peut être judicieux de le considérer ainsi.

Matthew Drury
la source
Bien que je sois d'accord avec vos déclarations, je pense que cela implique le contraire. Une fonction delta n'est pas un sous-ensemble de gaussiens. De même qu'une limite de fonctions continues n'a pas besoin d'être une fonction continue.
seanv507
@ seanv507 J'ai fait de mon mieux pour ne pas formuler de conclusion de toute façon!
Matthew Drury
1
Je pensais que les distributions ressemblaient beaucoup aux distributions de probabilités, avec une distribution delta (probabilité) de Dirac indiquant une variable déterministe ...
user541686
Si vous n'écrivez pas les limites des intégrales, elles peuvent être confondues avec des intégrales indéfinies. En outre, cette phrase n'a pas de sens: "Une fonction de test θ est une fonction vraie, honnête à Dieu, lisse, avec un support compact".
ogogmad
@jkabrg Pourquoi cela n'a-t-il pas de sens? Depuis que je l'ai écrit, j'ai du mal à voir que ça n'a pas de sens.
Matthew Drury
-1

Non. Ce n'est pas une sous-classe de distribution normale.

Je pense que la confusion vient d'une des représentations de la fonction Dirac. N'oubliez pas qu'il est défini comme suit:

δ(x)dx=1
δ(x)=0,x0

δ(x)=limσ0ex22σ22πσ

δ(x)=12πk=eikx,x(π,π)

Par conséquent, il est préférable de penser à la fonction de Dirac en termes de définition intégrale et de prendre les représentations de fonctions, telles que gaussiennes, comme des outils de commodité.

MISE À JOUR Au point de @ whuber, un meilleur exemple pair est cette représentation du delta de Dirac:

δ(x)=limσ0e|x|σ2σ

Est-ce que cela ressemble à une distribution laplacienne pour vous? Ne faut-il pas alors considérer le delta de Dirac comme une sous-classe de la distribution laplacienne?

Aksakal
la source
À un moment donné de cette réponse, vous semblez passer de la discussion des distributions à la discussion des "fonctions". La question se réfère explicitement aux «distributions de probabilité». Ceux-ci ne sont généralement pas donnés par les fonctions de densité, mais peuvent toujours être donnés par leur fonction de distribution. La distribution d'un atome - le "delta de Dirac" - s'intègre parfaitement avec toutes les autres distributions gaussiennes comme cas limite. (Dans la configuration de Matthew Drury, elle est définie comme cette limite!) Votre argument semble similaire à affirmer que, disons, les cercles ne sont pas des ellipses. L'application de telles exceptions ne semble pas constructive.
whuber
@whuber, qu'est-ce que la "distribution d'un atome"?
Aksakal
Un "atome" est un bloc de probabilité en un seul point. De manière équivalente, c'est la distribution de toute variable aléatoire qui est constante presque partout.
whuber
@whuber, Oh, je pensais à un atome physique. Non, mon point est que le delta de Dirac n'est pas une sous-classe de gaussien, car il peut également être représenté par des laplaciens comme des distributions
Aksakal
3
(0,1)(0,θ)(α,β)
whuber