Conceptuellement, je saisis la signification de l'expression "la surface totale sous un PDF est de 1". Cela devrait signifier que les chances que le résultat se situe dans l'intervalle total des possibilités sont de 100%.
Mais je ne peux pas vraiment le comprendre d'un point de vue "géométrique". Si, par exemple, dans un PDF, l'axe des x représente la longueur, l'aire totale sous la courbe ne deviendrait-elle pas plus grande si x était mesuré en mm plutôt qu'en km?
J'essaie toujours d'imaginer à quoi ressemblerait la zone sous la courbe si la fonction était aplatie en ligne droite. La hauteur (position sur l'axe des y) de cette ligne serait-elle la même pour n'importe quel PDF, ou aurait-elle une valeur dépendante de l'intervalle sur l'axe des x pour lequel la fonction est définie?
la source
Réponses:
La fonction de densité de probabilité est mesurée en pourcentages par unité de mesure de votre axe x. Disons qu'à un point donné votre PDF est égal à 1000. Cela signifie que la probabilité de est de où est en mètres. Si vous changez les unités en centimètres, alors la probabilité ne devrait pas changer pour le même intervalle, mais le même intervalle a 100 centimètres de plus que les mètres, donc et résolution nous obtenons . Il y a 100 fois moins d'unités de probabilité (pourcentages) par centimètre que par mètre.X0 X0< x < x0+ dX 1000réX réX 1000réx = PD F′( x′0) ⋅ 100réX′ PD F′( x′0) = PD F( x0)100
la source
Cela pourrait vous aider à réaliser que l'axe vertical est mesuré comme une densité de probabilité . Donc, si l'axe horizontal est mesuré en km, alors l'axe vertical est mesuré comme une densité de probabilité "par km". Supposons que nous dessinions un élément rectangulaire sur une telle grille, qui fait 5 "km" de large et 0,1 "par km" de haut (que vous préféreriez peut-être écrire comme "km - 1 "). L'aire de ce rectangle est de 5 km x 0,1 km - 1 = 0,5. Les unités s'annulent et nous nous retrouvons avec une probabilité de moitié seulement.- 1 - 1
Si vous avez changé les unités horizontales en "mètres", vous devrez changer les unités verticales en "par mètre". Le rectangle aurait maintenant une largeur de 5000 mètres et aurait une densité (hauteur) de 0,0001 par mètre. Il vous reste encore une probabilité de moitié. Vous pourriez être perturbé par la façon dont ces deux graphiques vont paraître bizarres sur la page l'un par rapport à l'autre (l'un ne doit-il pas être beaucoup plus large et plus court que l'autre?), Mais lorsque vous dessinez physiquement les tracés, vous pouvez utiliser n'importe quoi l'échelle que vous aimez. Regardez ci-dessous pour voir comment peu de bizarreries doivent être impliquées.
Il peut être utile de considérer les histogrammes avant de passer aux courbes de densité de probabilité. À bien des égards, ils sont analogues. L'axe vertical d'un histogramme est la densité de fréquence [par unité ]X et les zones représentent les fréquences, encore une fois parce que les unités horizontales et verticales s'annulent lors de la multiplication. La courbe PDF est une sorte de version continue d'un histogramme, avec une fréquence totale égale à un.
Une analogie encore plus étroite est un histogramme de fréquence relative - nous disons qu'un tel histogramme a été "normalisé", de sorte que les éléments de zone représentent désormais des proportions de votre ensemble de données d'origine plutôt que des fréquences brutes, et la zone totale de toutes les barres est une. Les hauteurs sont maintenant des densités de fréquence relatives [par unité ]X . Si un histogramme de fréquence relative a une barre qui s'étend le long de X valeurs de 20 km à 25 km (donc la largeur de la barre est de 5 km) et a une densité de fréquence relative de 0,1 par km, alors cette barre contient une proportion de 0,5 des données. Cela correspond exactement à l'idée qu'un élément choisi au hasard dans votre ensemble de données a une probabilité de 50% de se trouver dans cette barre. L'argument précédent sur l'effet des changements d'unités s'applique toujours: comparer les proportions de données situées dans la barre de 20 km à 25 km à celles de la barre de 20 000 mètres à 25 000 mètres pour ces deux parcelles. Vous pouvez également confirmer arithmétiquement que les zones de toutes les barres totalisent une dans les deux cas.
Qu'aurais-je pu signifier en affirmant que le PDF est une "sorte de version continue d'un histogramme"? Prenons une petite bande sous une courbe de densité de probabilité, le long de valeurs dans l'intervalle [ x , x + δ x ] , de sorte que la bande est δ x large et la hauteur de la courbe est un f ( x ) approximativement constant . On peut dessiner une barre de cette hauteur, dont l'aire f ( x )X [ x , x + δx ] δX F( x ) représente la probabilité approximative de se trouver dans cette bande.F( x )δX
Comment trouver l'aire sous la courbe entre et x = b ? On pourrait subdiviser cet intervalle en petites bandes et prendre la somme des aires des barres, ∑ f ( x )x = a x = b , ce qui correspondrait à la probabilité approximative de mentir dans l'intervalle [ a , b ] . Nous voyons que la courbe et les barres ne s'alignent pas précisément, il y a donc une erreur dans notre approximation. En faisant δ x de plus en plus petit pour chaque barre, on remplit l'intervalle de barres plus nombreuses et plus étroites, dont ∑ f ( x )∑ f( x )δX [ a , b ] δX fournit une meilleure estimation de la zone.∑ f( x )δX
Pour calculer précisément l'aire, plutôt que de supposer que était constant sur chaque bande, nous évaluons l'intégrale ∫ b a f ( x ) d x , ce qui correspond à la vraie probabilité de se situer dans l'intervalle [ a , b ] . L'intégration sur toute la courbe donne une aire totale (c.-à-d. La probabilité totale), pour la même raison que la somme des aires de toutes les barres d'un histogramme de fréquence relative donne une aire totale (c.-à-d. La proportion totale) de un. L'intégration est en soi une sorte de version continue de la prise d'une somme.F( x ) ∫buneF( x ) dX [ a , b ]
Code R pour les parcelles
la source
Vous avez déjà obtenu deux réponses, dont une excellente par Silverfish , mais je pense qu'une illustration pourrait être utile ici puisque vous avez posé des questions sur la géométrie et «vous imaginez» ces fonctions.
Commençons par un exemple simple de distribution de Bernoulli :
Comme les valeurs sont discrètes, il n'y a pas de "courbe" mais seulement deux points, mais l'idée est similaire: si vous voulez connaître la probabilité totale (zone sous la courbe), vous devez résumer les probabilités des deux résultats possibles:
0.010 0.028 0.094 0.198 0.260 0.400 0.404 0.292 0.166 0.092 0.044 0.010 0.002
Vous avez également posé des questions sur la distribution "plate" (uniforme) :
la source
L'idée clé suivante a été mentionnée dans un commentaire, mais pas dans une réponse existante ...
Une façon de comprendre les propriétés d'un PDF est de considérer que le PDF et le CDF sont liés par intégration (calcul) - et que le CDF a une sortie monotone représentant une valeur de probabilité comprise entre 0 et 1.
La zone totale intégrée sans unité sous la courbe PDF n'est pas affectée par les unités de l'axe X.
Pour le dire simplement ...
Si l'axe des X devient plus grand, numériquement, en raison d'un changement d'unités, alors l'axe des Y doit devenir plus petit d'un facteur linéaire correspondant .
la source