Le pdf et le pmf et le cdf contiennent-ils la même information?

17

Le pdf et le pmf et le cdf contiennent-ils la même information?

Pour moi, le pdf donne la probabilité totale à un certain point (essentiellement la zone sous la probabilité).

Le pmf donne la probabilité d'un certain point.

Le cdf donne la probabilité sous un certain point.

Donc pour moi le pdf et le cdf ont la même information, mais pas le pmf car il donne la probabilité d'un point xsur la distribution.

Kare
la source

Réponses:

25

Lorsqu'une distinction est faite entre la fonction de probabilité et la densité *, le pmf s'applique uniquement aux variables aléatoires discrètes, tandis que le pdf s'applique aux variables aléatoires continues.

* les approches formelles peuvent englober les deux et utiliser un seul terme pour elles

Le cdf s'applique à toutes les variables aléatoires, y compris celles qui n'ont ni pdf ni pmf.

entrez la description de l'image ici

(Une distribution mixte n'est pas le seul cas d'une distribution qui n'a pas de pdf ou pmf, mais c'est une situation assez courante - par exemple, considérez la quantité de pluie dans une journée, ou le montant d'argent payé en réclamations sur une police d'assurance de biens, dont l'un ou l'autre pourrait être modélisé par une distribution continue zéro gonflée)

Le cdf pour une variable aléatoire donne P ( X x )XP(Xx)

Le pmf pour une variable aléatoire discrète , donne P ( X = x ) .XP(X=x)

Le pdf ne donne pas lui-même des probabilités , mais des probabilités relatives; les distributions continues n'ont pas de probabilités ponctuelles. Pour obtenir des probabilités de pdfs, vous devez intégrer sur un certain intervalle - ou prendre une différence de deux valeurs cdf.

Il est difficile de répondre à la question «contiennent-ils les mêmes informations» car cela dépend de ce que vous voulez dire. Vous pouvez passer du pdf au cdf (via l'intégration), et du pmf au cdf (via la sommation), et du cdf au pdf (via la différenciation) et du cdf au pmf (via la différenciation), donc si un pmf ou un pdf existe, il contient les mêmes informations que le cdf.

Glen_b -Reinstate Monica
la source
1
Glen, pourriez-vous m'aider en fournissant une référence où je pourrais lire sur "pdf donnant des probabilités relatives"? C'est très intéressant et je ne me souviens pas l'avoir vu dans mes livres. Merci.
Alecos Papadopoulos
@Alecos C'est simplement une explication (peut-être mal formulée) du fait que si n'est pas une probabilité, puisque f ( x )f(x) est la probabilité d'être dans ( x , x + d x ) , alors f ( x ) / g ( x ) peut être considéré comme le rapport de la probabilité qu'une variable de densité f soit à une très petite distance de x au rapport qu'une variable de densité g est dans le même intervalle. En ce sens, il exprime la «probabilité relative». f(x)dx(x,x+dx)f(x)/g(x)fxg
Glen_b -Reinstate Monica
Je vois. Elle est certainement valable comme approximation du rapport des probabilités, et certainement présente dans les fonctions de densité empirique, où les choses sont discrètes par nécessité.
Alecos Papadopoulos
10

Les PMF sont associés à des variables aléatoires discrètes, les PDF à des variables aléatoires continues. Pour tout type de variable aléatoire ou aléatoire, le CDF existe toujours (et est unique), défini comme Maintenant, selon l'ensemble de support de la variable aléatoire X , la densité (ou la fonction de masse) n'a pas besoin d'exister. (Considérez l' ensemble Cantor et la fonction Cantor , l'ensemble est défini récursivement en supprimant le centre 1/3 de l'intervalle unitaire, puis en répétant la procédure pour les intervalles (0, 1/3) et (2/3, 1), etc. La fonction est définie comme C ( x

FX(x)=P{Xx}.
X , si x est dans l'ensemble Cantor, et la plus grande borne inférieure dans l'ensemble Cantor si x n'est pas un membre.) La fonction Cantor est une fonction de distribution parfaitement bonne, si vous clouez sur C ( x ) = 0 si x < 0 et C ( x ) = 1 si 1 < x . Mais ce cdf n'a pas de densité: C ( x ) est continu partout mais sa dérivée est 0 presque partout. Aucune densité par rapport à toute mesure utile.C(x)=xxxC(x)=0x<0C(x)=11<xC(x)

Donc, la réponse à votre question est, s'il existe une fonction de densité ou de masse, alors c'est un dérivé du CDF par rapport à une certaine mesure. En ce sens, ils portent les "mêmes" informations. MAIS, les PDF et les PMF n'ont pas besoin d'exister. Les CDF doivent exister.

Dennis
la source
2
Dennis, pouvez-vous clarifier ce que vous entendez par l'expression " Aucune densité par rapport à une mesure quelconque "? Certes, il a une densité (uniforme!) Par rapport à lui-même.
cardinal
@cardinal: J'essaierai, mais je ne sais pas si cela aura du sens à moins d'avoir étudié une vraie analyse. Si vous regardez certains livres plus anciens sur les statistiques mathématiques (par exemple, les statistiques mathématiques de Freund ), vous verrez des PMF appelés "densités". Le nom "densité" est justifié par la mesure de probabilité sur l'espace mesurable ( Ω , σ ( Ω ) , μ ) est la base du CDF (voir commentaire de Joel). La densité est la dérivée de Radon-Nikodym de μ par rapport à une certaine mesure (généralement la mesure de Lesbesgue ou la mesure de comptage). Dans ce cas, C ( x )μ(Ω,σ(Ω),μ)μC(x)n'a pas de dérivé RN.
Dennis
3
@cardinal (suite): La mesure de probabilité est uniforme sur l'ensemble Cantor, mais c'est une bête si étrange que je ne sais même pas à quoi ressemble l'algèbre . J'aurais peut-être dû dire: «Aucune densité par rapport à toute mesure utile». σ
Dennis
2

Les autres réponses indiquent que les CDF sont fondamentaux et doivent exister, alors que les PDF et les PMF n'existent pas et n'existent pas nécessairement.

S1

Il me semble que la réponse est que la fonction fondamentale est la mesure de probabilité , qui mappe chaque sous-ensemble (considéré) de l'espace d'échantillonnage à une probabilité. Puis, lorsqu'ils existent, les CDF, PDF et PMF découlent de la mesure de probabilité.

Joel Bosveld
la source
1
De la façon dont je l'ai vu, la plupart des manuels définissent la «variable aléatoire» comme un mappage d'un espace échantillon aux nombres réels. Essentiellement, une "variable aléatoire" a une valeur réelle.
Neil G
1
(R,B,F)(Ω,σ(Ω),μ)Ωμ
FX(x)=μ{ω|X(ω)x}.