Je ne comprends pas pourquoi je ne peux pas simplement ajouter 1,5 écart-type pour obtenir la réponse.
Si 1 écart-type est de 10 kg et que la moyenne est de 400 kg, alors 415 kg correspond à 1,5 écart-type.
Je l'ai donc calculé comme ceci: .3413 + ((.4772-.3413)/2) = 0.40925
Cette équation prend la moitié de la différence entre deux écarts-types et un écart-type, puis l'ajoute au premier écart-type.
Pourquoi ça ne marche pas? Pourquoi dois-je utiliser le tableau fourni?
Réponses:
La raison pour laquelle nous ne pouvons pas (linéairement) interpoler entre 0,3413 et 0,4772 est parce que le pdf de la distribution normale n'est pas uniforme (plat à une seule valeur).
Prenons cet exemple plus simple, où nous pouvons utiliser la géométrie pour trouver les zones.
La superficie totale de l'intrigue est
1
(c'est un carré coupé en diagonale, avec les deux pièces réarrangées pour être un triangle). En utilisant,Base*Height/2
nous pouvons constater que l'aire de la région A est0.5
, et l'aire totale des régions B et C l'est également0.5
.Mais les zones de B et C ne sont pas égales. L'aire de la région C est
0.5*0.5/2 = 0.125
, et donc l'aire de la région B est0.375
. Ainsi, même si les régions B et C sont également larges le long de l'axe des x, puisque la hauteur n'est pas constante, elles ont des zones différentes.La distribution normale à laquelle vous faites face dans votre exercice est similaire, mais avec une fonction plus compliquée pour la hauteur au lieu d'un simple triangle. Pour cette raison, la zone entre deux valeurs ne peut pas être résolue aussi simplement - d'où l'utilisation de scores Z et d'un tableau pour trouver des probabilités.
la source
Juste pour fournir une illustration différente sur le même sujet ...
Dans votre calcul initial, vous traiteriez la courbe normale comme une distribution uniforme, auquel cas votre approche initiale serait le calcul mathématique correct pour le rectangle double hachuré dans le graphique ci-dessous (avec différentes valeurs réelles), simplement parce que vous seriez capable d'exprimer la zone comme une simple dépendance linéaire de laX distance d'axe:
Mais vous voulez calculer la zone hachurée en diagonale sous la courbe de la distribution gaussienne, qui, comme indiqué précédemment, ne garderait pas une relation linéaire avec la distance le long de laX même si la distribution était triangulaire:
7
la source
La formule de la distribution gaussienne est:
Où sigma = écart std et mu = moyenne
(volé sur wikipedia)
Lorsque vous demandez la zone, vous intégrez cette fonction sur la plage spécifiée. Cette intégrale n'a pas de solution de "forme fermée": il n'y a aucun moyen de trouver une expression utilisant des fonctions mathématiques "normales" comme factorielle, multiplication, exponentiation, racines, etc. qui est égale à cette intégrale.
C'est comme des logarithmes ou des fonctions trigonométriques: vous ne pouvez pas produire une équation de forme fermée pour eux en utilisant d'autres fonctions algébriques (vous pouvez utiliser des séries infinies, mais ce n'est pas "fermé"). Vous utilisez donc une table (si vous vous sentez rétro, ou une calculatrice, qui utilise simplement une table pour vous dans les coulisses intégrée dans son processeur comme point de départ) lorsque vous devez réellement la calculer.
En fait, le parallèle avec les logarithmes est tout à fait approprié: on peut également définir un logarithme par une intégrale, à savoir ln (x) = intégrale de (1 / x) de 0 à x.
la source
Géométriquement,
.4772 - .3413
représente l'aire sous le graphique entre 1 écart-type et 2 écarts-types. Si vous divisez cette région à mi-chemin horizontalement, la partie à gauche du fractionnement sera la zone entre 1 et 1,5 écart-type, comme vous le souhaitez. Très bien jusqu'à présent.Cependant, lorsque vous prenez,
(.4772 - .3413) / 2
vous obtenez la moitié de la surface , mais pas nécessairement ce que vous recherchiez, ce qui est cependant une grande partie de la zone à mi-chemin horizontalement. Avec ce graphique, cette partie gauche de la division n'est pas la moitié de la zone - la ligne est en pente vers le bas (allant du haut à gauche au bas à droite), donc il y a plus d'espace dans la partie gauche que dans la partie droite. Si ce graphique était une ligne horizontale droite, la zone que vous séparez serait un rectangle et la moitié de la zone serait à mi-chemin.la source