Les termes fonction de densité de probabilité et distribution de probabilité (ou simplement «distribution») sont-ils interchangeables?

8

Comme le dit le titre, les termes fonction de densité de probabilité et distribution de probabilité (ou simplement "distribution") sont-ils interchangeables? Sinon, quelle est la différence?

pdf
la source
2
Des deux, je pense en fait que c'est la question la mieux posée à bien des égards. Mais en tant que dernier des deux, c'est probablement celui qui devrait être fermé.
Silverfish
@Silverfish Non seulement cette question est mieux posée que l'autre, mais elle pose, à mon avis, quelque chose de différent. En effet, la réponse (unique et acceptée) à l'autre question ne répond pas du tout à cette question, sauf peut-être dans la toute dernière phrase. Je vote pour le rouvrir; vous pouvez peut-être vous joindre à moi. J'avoue que j'ai un arrière-plan. Les questions fermées car les doublons sont rarement vus par la plupart des gens, et je ne veux pas avoir perdu mon temps à écrire une réponse ici. Par ailleurs, il est dommage de priver les gens du plaisir de dévaloriser ma réponse polémique.
Dilip Sarwate
@Dilip Si les fils étaient vraiment des doublons, nous les fusionnions, ce qui faisait que votre contribution faisait partie du fil d'origine. Dans ce cas, cependant, je suis d'accord avec votre affirmation selon laquelle la question diffère suffisamment pour justifier la réouverture de ce fil.
whuber
@Dilip Si cela devait rester fermé, une approche pour augmenter la visibilité des réponses liées mais pas identiques est de renvoyer ici via un commentaire dans la question, il serait fermé en double.
Glen_b -Reinstate Monica
Quelqu'un peut-il poster ici un lien vers l'ancien dup proposé?
kjetil b halvorsen

Réponses:

5

L'expression fonction de densité de probabilité (pdf) signifie une chose spécifique: une fonction pour une variable aléatoire spécifique (c'est à cela que sert cet indice, pour distinguer cette fonction des pdfs d'autres variables aléatoires) avec la propriété que pour tous les nombres réels et tels que , Les différentes intégrales sont destinées à rappeler que peu importe le symbole que nous utilisons comme argument de et qu'il n'est pasfX()Xaba<b

P{a<Xb}=abfX(u)du=abfX(v)dv=abfX(t)dt.
fX()le cas (comme le croient malheureusement trop souvent ceux qui commencent sur ce sujet) que l'argument doit être la lettre minuscule correspondant à la lettre majuscule qui désigne la variable aléatoire. Nous insistons également sur le fait que Si pour un certain nombre réel , alors n'a pas un pdf sauf pour ceux qui intègrent des deltas de Dirac dans leur calcul de probabilité.
fX(u)du=1.
P{X=α}>0αX

La fonction de distribution de probabilité cumulative (cdf ou CDF) de est la fonction définie comme Il est lié au pdf (pour les fonctions qui ont un pdf) à travers FX()X

FX(α)=P{Xα},<α<.
FX(α)=αfX(u)du.

=======

Bien qu'il puisse y avoir une définition très restrictive de la distribution de probabilité d' expression sur laquelle certaines personnes insistent, l'utilisation familière du terme englobe largement le pdf et le CDF et le pmf (fonction de masse de probabilité qui est également appelée la fonction de densité discrète ou ddf) et tout ce que nous pourrions vouloir inclure comme descriptif du comportement probabiliste d'une variable aléatoire. Par exemple, la phrase

la distribution de probabilité de est uniforme sur X(a,b)

ne sera presque jamais interprété comme signifiant que le CDF de a une valeur constante sur !! Bien que ce soit la distribution qui soit considérée comme uniforme, tout le monde dans son bon sens considérera cela comme signifiant que la densité de a une valeur constante sur l'intervalle (et a la valeur ailleurs). De même, pour " est uniformément distribué sur " alors que cela signifie que le pdf de a une valeur constante sur .X(a,b) X(ba)1(a,b)0X(a,b)X(a,b)

Comme autre exemple d'utilisation familière de la distribution pour la densité moyenne , considérons cette citation d'une réponse récemment publiée par le modérateur Glen_b.

"Dire le mode implique que la distribution en a un et un seul."

Une densité peut posséder un mode unique mais un CDF ne peut pas avoir un mode unique (dans les réels non étendus). Cependant, personne qui lit cette citation ne pensera probablement que Glen_b voulait dire le CDF quand il a écrit "distribution".

Dilip Sarwate
la source
1
+1, mais j'ai quelques réserves sur l'accent mis sur les différents points de cette réponse. Le dernier point selon lequel un PDF n'est pas défini de manière unique - c'est en fait une classe d'équivalence de fonctions - soutient une thèse différente selon laquelle la "distribution de probabilité" ne se réfère même pas familièrement au PDF (sauf comme un abus de terminologie). Il est clair que le CDF, qui (sous réserve de la restriction cadlag) est défini de manière unique pour toutes les variables, est un bien meilleur candidat pour être le référent de "la distribution" de toute variable aléatoire. L1
whuber
1
@whuber Merci d'avoir rouvert la question et le vote positif. J'ai supprimé la variable normale aléatoire et l'ai remplacée par une meilleure illustration de la raison pour laquelle "distribution" ne signifie pas toujours CDF mais peut être un substitut pour la densité ou le pdf.
Dilip Sarwate
1
Dans l'édition, vous faites un très bon cas au nom de votre interprétation de l'usage familier.
whuber
2

En termes d'utilisation courante, envisagez d'analyser la terminologie utilisée dans R. La description de la page d'aide sur les distributions {stats} indique:

La densité, la fonction de distribution cumulative, la fonction quantile et la génération de variables aléatoires pour de nombreuses distributions de probabilité standard sont disponibles dans le package de statistiques.

Pour chacun des intégrés distributions, elle fournit (selon les différentes pages d'aide) la « densité » (par exemple dnormpour Normal, dbinompour binomiale) et la « fonction de distribution » (par exemple pnorm, pbinom, appelé la « fonction de distribution cumulative » sur la page principale des distributions, comme indiqué ci-dessus).

On pourrait donc interpréter que la "distribution de probabilité" décrit (peut-être un membre de) une famille de distributions, la "densité" peut être utilisée pour des distributions discrètes comme le binôme, et l'expression "fonction de distribution" pourrait être préférée à "distribution" lorsque le la fonction de distribution cumulative est ce qui est prévu.

Alternativement, on pourrait faire valoir que l'usage courant, même parmi les personnes expérimentées, dépend souvent du contexte pour plus de clarté.

EdM
la source
0

Non.

  1. la "fonction de densité de probabilité" n'est utilisée que pour les distributions continues. Une distribution discrète ne peut pas avoir de pdf (bien qu'elle puisse être approximée avec un pdf). la "distribution de probabilité" est souvent utilisée pour les distributions discrètes, par exemple la distribution binomiale.

  2. "distribution de probabilité" a une signification pour les distributions discrètes et continues, mais une distribution de probabilité n'est directement applicable que pour les distributions discrètes. Lorsque le mot est utilisé avec des distributions continues, il fait référence à une construction mathématique sous-jacente telle que la distribution normale, qui doit dans la plupart des cas être instanciée dans une fonction, généralement une fonction de densité de probabilité ou une fonction de densité cumulative, avant de pouvoir être appliquée.

Phil Goetz
la source
1
"'distribution de probabilité' est généralement utilisée pour, et seulement bien définie pour, la distribution discrète" Voulez-vous dire que, par exemple, une distribution normale n'est pas une distribution de probabilité?
Juho Kokkala
@Kokkala: Si j'avais voulu dire cela, j'aurais simplement dit que "la distribution de probabilité" ne devrait être utilisée que pour des distributions discrètes. " Ces mots supplémentaires devaient permettre des cas où les gens appellent par exemple une distribution normale une distribution de probabilité. Mais vous soulevez un bon point: dans les domaines continus, la "distribution de probabilité" est toujours utilisée, mais pour appliquer une distribution de probabilité, nous devons en utiliser une instanciation plus spécifique, comme un pdf ou un cdf. Je vais donc modifier ma réponse si je le peux.
Phil Goetz
1
Il existe une définition formelle commune de la «distribution de probabilité» qui entre en conflit avec votre point (2); à savoir, la distribution de toute variable aléatoire de valeur réelle est donnée par la fonction Ceci est clairement "directement applicable" à toutes les distributions, pas seulement aux distributions discrètes. XxPr(Xx).
whuber
1
Les modes changent à ce sujet. La fonction de masse de probabilité d' expression a été introduite pour rendre le cas discret tout à fait distinct, mais à l'inverse, de nombreux auteurs expliquent que la densité peut être définie en termes de mesure de comptage. Tout est une question de mesure sous-jacente. Donc non; des rédacteurs compétents peuvent écrire sur les fonctions de densité et avoir une définition large à l'esprit, et pas seulement l'applicabilité à des variables continues. Le texte de probabilité intermédiaire de Peter Whittle en est un exemple.
Nick Cox