Comment dois-je interpréter la hauteur des tracés de densité:
Par exemple, dans le graphique ci-dessus, le pic est d'environ 0,07 à x = 18. Puis-je en déduire qu'environ 7% des valeurs sont d'environ 18? Puis-je être plus précis que ça? Il y a aussi un deuxième pic à x = 30 avec une hauteur de 0,02. Cela signifierait-il qu'environ 2% des valeurs se situent autour de 30?
Edit: La question sur Est-ce qu'une valeur de distribution de probabilité supérieure à 1 peut être OK?traite de la valeur de probabilité de> 1 qui n'est pas du tout un problème ici. Il discute également de cela en relation avec le classfier naïf de Bayes qui n'est pas non plus le point ici. Je veux avoir, dans un langage simple, les inférences numériques que nous pouvons tirer de ces courbes de densité. Le rôle de l'aire sous la courbe est discuté, mais ma question est précisément quelle inférence pouvons-nous tirer concernant une combinaison x et y particulière qui existe sur la courbe. Par exemple, comment pouvons-nous relier x = 30 et y = 0,02 sur ce graphique. Quelle déclaration pouvons-nous écrire concernant la relation entre 30 et 0,02 ici. Puisque les densités sont pour une valeur unitaire, peut-on dire que 2% des valeurs se produisent entre 29,5 et 30,5? Si tel est le cas, comment interpréter si les valeurs varient de seulement 0 à 1, comme dans le graphique suivant:
Si 100% des valeurs se produisent entre 0 et 1, pourquoi y a-t-il une courbe en dehors de 0 et 1?
Il y a une partie plate ici à x = 0,1 à x = 0,2 où y est égal à 0,8. Il forme un rectangle. Comment savoir quelle proportion de valeurs se produisent entre x = 0,1 et x = 0,2
(PS: Si vous trouvez cette question intéressante / importante, veuillez la voter;)
Réponses:
Vous devez être prudent avec votre formulation ici. En supposant que x est une variable continue, la probabilité d'une valeur individuelle est précisément nulle. Parler, comme vous l'avez fait, de la probabilité qu'une valeur se situe autour d'un certain point, c'est bien, même si vous voudrez peut-être être un peu plus précis. Votre deuxième affirmation, dans laquelle vous avez fourni l'intervalle ainsi que la probabilité, est quelque chose que je rechercherais.
En substance, une intégrale de la fonction de densité par rapport à x vous renseignera sur la probabilité elle-même (c'est pourquoi elle est appelée densité ). De toute évidence, l'intervalle sur lequel vous intégrerez peut être arbitrairement petit, vous pouvez donc vous rapprocher d'un point à un degré arbitraire. Cela dit, lorsque la fonction de densité varie très lentement au cours de cet intervalle, vous pouvez approximer l'intégrale par une technique numérique, telle que la règle trapézoïdale .
Pour résumer: la hauteur de la fonction de densité n'est que cela, sa hauteur. Tout ce que vous voudrez peut-être conclure sur la probabilité devra inclure l'intégration d'une forme ou d'une autre.
la source