Mon stat prof dit, en gros, si l’un des trois suivants est donné, vous pouvez trouver les deux autres:
- Fonction de distribution cumulative
- Fonction de génération de moment
- Fonction de densité de probabilité
Mais mon professeur d'économétrie a déclaré que les CDF sont plus fondamentaux que les PDF car il existe des exemples dans lesquels vous pouvez avoir un CDF mais le PDF n'est pas défini.
Les CDF sont-ils plus fondamentaux que les PDF? Comment savoir si un PDF ou un MGF peut être dérivé d'un CDF?
probability
pdf
cdf
mgf
Stan Shunpike
la source
la source
Réponses:
Chaque distribution de probabilité sur (un sous-ensemble de) a une fonction de distribution cumulative et définit de manière unique la distribution. Donc, dans ce sens, le CDF est en effet aussi fondamental que la distribution elle-même.Rn
Une fonction de densité de probabilité , cependant, n'existe que pour les distributions de probabilité (absolument) continues . L'exemple le plus simple d'une distribution dépourvue de PDF est une distribution de probabilité discrète , telle que la distribution d'une variable aléatoire ne prenant que des valeurs entières.
Bien entendu, de telles distributions de probabilité discrètes peuvent être caractérisées par une fonction de masse de probabilité , mais il existe également des distributions qui n'ont ni PDF ni PMF, telles que tout mélange d'une distribution continue et d'une distribution discrète:
(Diagramme volé sans vergogne de la réponse de Glen_b à une question connexe.)
Il existe même des distributions de probabilité singulières , telles que la distribution de Cantor , qui ne peuvent même pas être décrites par une combinaison de PDF et de PMF. Toutefois, ces distributions ont toujours un CDF bien défini. Par exemple, voici le CDF de la distribution Cantor, également appelé parfois "l'escalier du diable":
( Image tirée de Wikimedia Commons par les utilisateurs Theon et Amirki , utilisée sous la licence CC-By-SA 3.0 .)
La fonction CDF, appelée fonction Cantor , est continue mais pas absolument continue. En fait, il est constant partout sauf sur un ensemble Cantor de zéro Lebesgue, mais qui contient toujours une infinité de points. Ainsi, toute la masse de probabilité de la distribution de Cantor est concentrée sur ce sous-ensemble extrêmement petit de la droite numérique, mais chaque point de l'ensemble a toujours une probabilité nulle.
Il existe également des distributions de probabilité qui n'ont pas de fonction génératrice de moment . L'exemple le plus connu est probablement la distribution de Cauchy , une distribution à la queue grasse qui n'a pas de moments bien définis d'ordre 1 ou supérieur (donc, en particulier, n'ayant pas de moyenne ni de variance bien définies!).
Cependant, toutes les distributions de probabilité sur ont une fonction caractéristique (éventuellement à valeur complexe ), dont la définition ne diffère de celle du facteur MGF que par une multiplication avec l' unité imaginaire . Ainsi, la fonction caractéristique peut être considérée comme aussi fondamentale que la fonction CDF.Rn
la source
Je crois que votre professeur d'économétrie pensait quelque chose dans le sens suivant.
Par la définition d'un PDF, il faut avoir
nous aurions besoin
Vous pouvez récupérer l'esprit d'un PDF, mais vous devez utiliser des objets mathématiques plus sophistiqués, soit une mesure, soit une distribution .
la source
Ilmari donne une bonne réponse d'un point de vue théorique. Cependant, on peut aussi se demander à quoi servent la densité (pdf) et la fonction de distribution (pdf) pour des calculs pratiques. Cela pourrait préciser pour quelles situations l’une est plus directement utile que l’autre.
La densité est toutefois essentielle pour les statistiques, car la probabilité est définie en termes de densité. Ainsi, si nous voulons calculer l'estimation du maximum de vraisemblance, nous avons directement besoin de la densité.
Si nous nous tournons vers la comparaison d’une distribution empirique et d’une distribution théorique, les deux peuvent être utiles, mais des méthodes telles que les diagrammes pp et qq basées sur la fonction de distribution sont souvent préférées.
la source