Comment interpréter la hauteur du tracé de densité

12

Comment dois-je interpréter la hauteur des tracés de densité:

entrez la description de l'image ici

Par exemple, dans le graphique ci-dessus, le pic est d'environ 0,07 à x = 18. Puis-je en déduire qu'environ 7% des valeurs sont d'environ 18? Puis-je être plus précis que ça? Il y a aussi un deuxième pic à x = 30 avec une hauteur de 0,02. Cela signifierait-il qu'environ 2% des valeurs se situent autour de 30?

Edit: La question sur Est-ce qu'une valeur de distribution de probabilité supérieure à 1 peut être OK?traite de la valeur de probabilité de> 1 qui n'est pas du tout un problème ici. Il discute également de cela en relation avec le classfier naïf de Bayes qui n'est pas non plus le point ici. Je veux avoir, dans un langage simple, les inférences numériques que nous pouvons tirer de ces courbes de densité. Le rôle de l'aire sous la courbe est discuté, mais ma question est précisément quelle inférence pouvons-nous tirer concernant une combinaison x et y particulière qui existe sur la courbe. Par exemple, comment pouvons-nous relier x = 30 et y = 0,02 sur ce graphique. Quelle déclaration pouvons-nous écrire concernant la relation entre 30 et 0,02 ici. Puisque les densités sont pour une valeur unitaire, peut-on dire que 2% des valeurs se produisent entre 29,5 et 30,5? Si tel est le cas, comment interpréter si les valeurs varient de seulement 0 à 1, comme dans le graphique suivant:

entrez la description de l'image ici

Si 100% des valeurs se produisent entre 0 et 1, pourquoi y a-t-il une courbe en dehors de 0 et 1?

Il y a une partie plate ici à x = 0,1 à x = 0,2 où y est égal à 0,8. Il forme un rectangle. Comment savoir quelle proportion de valeurs se produisent entre x = 0,1 et x = 0,2

(PS: Si vous trouvez cette question intéressante / importante, veuillez la voter;)

rnso
la source
4
Le premier fil mentionné comme doublon est pertinent, malgré le libellé précis de son titre, car il fait valoir que, calculée pour les variables continues, une densité de probabilité n'est pas une probabilité. (Une version plus subtile définirait la densité rigoureusement et inclurait la possibilité que la densité soit définie par une mesure de comptage.)
Nick Cox
Je suis d'accord avec @NickCox, bien qu'avec les modifications supplémentaires, l'accent soit davantage mis sur la surface (qui ressemble à la troisième question) ainsi que sur la hauteur (qui ressemble davantage à la deuxième question) dans la très bonne liste de Tim de questions étroitement liées.
Silverfish
3
Il y a aussi une question distincte qui n'est pas soulevée dans ces questions, c'est pourquoi je ne pense pas que ce soit globalement un double de ces questions individuellement: pourquoi dans les graphiques empiriques par opposition aux graphiques théoriques de densité, peut-il y avoir de la "densité" à l'extérieur le support (ou les valeurs observées) de la distribution? Cela nécessite une discussion supplémentaire sur la bande passante et la construction et l'interprétation des tracés de densité du noyau. Peut-être que cette question bénéficierait d'une révision et d'un recentrage sur les problèmes qui ne font pas double emploi avec les questions existantes.
Silverfish

Réponses:

6

Vous devez être prudent avec votre formulation ici. En supposant que x est une variable continue, la probabilité d'une valeur individuelle est précisément nulle. Parler, comme vous l'avez fait, de la probabilité qu'une valeur se situe autour d'un certain point, c'est bien, même si vous voudrez peut-être être un peu plus précis. Votre deuxième affirmation, dans laquelle vous avez fourni l'intervalle ainsi que la probabilité, est quelque chose que je rechercherais.

En substance, une intégrale de la fonction de densité par rapport à x vous renseignera sur la probabilité elle-même (c'est pourquoi elle est appelée densité ). De toute évidence, l'intervalle sur lequel vous intégrerez peut être arbitrairement petit, vous pouvez donc vous rapprocher d'un point à un degré arbitraire. Cela dit, lorsque la fonction de densité varie très lentement au cours de cet intervalle, vous pouvez approximer l'intégrale par une technique numérique, telle que la règle trapézoïdale .

Pour résumer: la hauteur de la fonction de densité n'est que cela, sa hauteur. Tout ce que vous voudrez peut-être conclure sur la probabilité devra inclure l'intégration d'une forme ou d'une autre.

Fato39
la source
l'aire sous la courbe est-elle toujours égale à 1,0 dans ce type de tracé?
ecologist1234
1