Pourquoi ne puis-je pas calculer 1,5 écart-type en utilisant les mathématiques de base?

8

Le problème de distribution normal

Je ne comprends pas pourquoi je ne peux pas simplement ajouter 1,5 écart-type pour obtenir la réponse.

Si 1 écart-type est de 10 kg et que la moyenne est de 400 kg, alors 415 kg correspond à 1,5 écart-type.

Je l'ai donc calculé comme ceci: .3413 + ((.4772-.3413)/2) = 0.40925

Cette équation prend la moitié de la différence entre deux écarts-types et un écart-type, puis l'ajoute au premier écart-type.

Pourquoi ça ne marche pas? Pourquoi dois-je utiliser le tableau fourni?

Ben
la source
5
Où avez-vous obtenu les chiffres 0.3413, 0.4772 et 0.3413? Dans tous les cas, la raison pour laquelle vous ne pouvez pas simplement ajouter 1,5 SD est parce qu'ils vous ont demandé la zone sous la courbe, pour laquelle vous devez utiliser le tableau normal qui vous donne ces zones.
mb7744
3
@Ben Le problème indique que l'écart type est 10. Sauf si vous voulez dire que vous avez calculé une valeur qui correspond à 1 écart type et calculé une autre valeur qui correspond à 2 écarts types. Mais si c'est le cas, c'est ce que mb7744 demandait.
Jelsema
1
@jelsema yes le côté droit de 1 écart-type comprend 34,13% des résultats. Le deuxième écart-type comprend 47,72% des résultats. Parce que ses seulement 1,5 écart-type, nous prenons la différence entre le premier écart-type et le deuxième écart-type et en obtenons la moitié depuis ses seulement 1,5 écart-type.
Ben
8
@Ben, vous interpolez linéairement. C'est invalide, c'est-à-dire que ce n'est pas exactement correct, parce que l'aire sous la courbe (disons à partir de la moyenne) n'est pas une fonction linéaire du nombre d'écarts-types; s'il l'était, alors le chiffre de 2 écarts-types de 0,4772 serait le double du chiffre de 1 écart-type de 0,3413, ce qui n'est pas le cas.
Mark L. Stone
1
Je veux savoir 5 au carré. Alors pourquoi ne puis-je pas simplement prendre 10 carrés (ce qui est 100) et les diviser par deux?
user253751

Réponses:

20

La raison pour laquelle nous ne pouvons pas (linéairement) interpoler entre 0,3413 et 0,4772 est parce que le pdf de la distribution normale n'est pas uniforme (plat à une seule valeur).

Prenons cet exemple plus simple, où nous pouvons utiliser la géométrie pour trouver les zones.

entrez la description de l'image ici

La superficie totale de l'intrigue est 1(c'est un carré coupé en diagonale, avec les deux pièces réarrangées pour être un triangle). En utilisant, Base*Height/2nous pouvons constater que l'aire de la région A est 0.5, et l'aire totale des régions B et C l'est également 0.5.

Mais les zones de B et C ne sont pas égales. L'aire de la région C est 0.5*0.5/2 = 0.125, et donc l'aire de la région B est 0.375. Ainsi, même si les régions B et C sont également larges le long de l'axe des x, puisque la hauteur n'est pas constante, elles ont des zones différentes.

La distribution normale à laquelle vous faites face dans votre exercice est similaire, mais avec une fonction plus compliquée pour la hauteur au lieu d'un simple triangle. Pour cette raison, la zone entre deux valeurs ne peut pas être résolue aussi simplement - d'où l'utilisation de scores Z et d'un tableau pour trouver des probabilités.

Jelsema
la source
1
Puis-je utiliser l'interpolation linéaire pour deviner la réponse à choix multiple? Puisqu'ils sont si éloignés l'un de l'autre? C'est une mauvaise idée?
Ben
2
@Ben C'est généralement une excellente idée. Des tests à choix multiples sont construits pour ce type de manipulation. Être capable d'estimer la taille d'une réponse est une capacité très utile tout au long de la vie. Il est également bon que vous posiez des questions sur ce problème et que vous le compreniez, car au fur et à mesure, il y aura de plus en plus de questions comme celle-ci qui n'ont pas de formule de réponse.
rhaskett
6
@rhaskett bien que la présence de "rien de ce qui précède" ne gâche cette stratégie.
David Z
@Ben Une fois qu'il est temps de tester, bien sûr, utilisez n'importe quelle méthode pour obtenir la bonne réponse. Cependant, un problème avec les tests à choix multiples est qu'ils permettent de deviner et de vérifier les stratégies pour contourner la nécessité de résoudre réellement une valeur. À long terme, à moins qu'il ne s'agisse de votre cours de mathématiques terminale, la dépendance à l'égard de cette stratégie vous fera plus de mal qu'elle ne vous aidera.
Dean MacGregor
@DavidZ True. J'ai raté cette option.
rhaskett
6

Juste pour fournir une illustration différente sur le même sujet ...

Dans votre calcul initial, vous traiteriez la courbe normale comme une distribution uniforme, auquel cas votre approche initiale serait le calcul mathématique correct pour le rectangle double hachuré dans le graphique ci-dessous (avec différentes valeurs réelles), simplement parce que vous seriez capable d'exprimer la zone comme une simple dépendance linéaire de la X distance d'axe:

UNE1,5S=UNE2S-UNE1S2=hejeghtX2S-X1S2

Mais vous voulez calculer la zone hachurée en diagonale sous la courbe de la distribution gaussienne, qui, comme indiqué précédemment, ne garderait pas une relation linéaire avec la distance le long de la X même si la distribution était triangulaire:

7

Antoni Parellada
la source
2

La formule de la distribution gaussienne est:

équation de Gauss

Où sigma = écart std et mu = moyenne

(volé sur wikipedia)

Lorsque vous demandez la zone, vous intégrez cette fonction sur la plage spécifiée. Cette intégrale n'a pas de solution de "forme fermée": il n'y a aucun moyen de trouver une expression utilisant des fonctions mathématiques "normales" comme factorielle, multiplication, exponentiation, racines, etc. qui est égale à cette intégrale.

C'est comme des logarithmes ou des fonctions trigonométriques: vous ne pouvez pas produire une équation de forme fermée pour eux en utilisant d'autres fonctions algébriques (vous pouvez utiliser des séries infinies, mais ce n'est pas "fermé"). Vous utilisez donc une table (si vous vous sentez rétro, ou une calculatrice, qui utilise simplement une table pour vous dans les coulisses intégrée dans son processeur comme point de départ) lorsque vous devez réellement la calculer.

En fait, le parallèle avec les logarithmes est tout à fait approprié: on peut également définir un logarithme par une intégrale, à savoir ln (x) = intégrale de (1 / x) de 0 à x.

Néologisme intelligent
la source
0

Géométriquement, .4772 - .3413représente l'aire sous le graphique entre 1 écart-type et 2 écarts-types. Si vous divisez cette région à mi-chemin horizontalement, la partie à gauche du fractionnement sera la zone entre 1 et 1,5 écart-type, comme vous le souhaitez. Très bien jusqu'à présent.

Cependant, lorsque vous prenez, (.4772 - .3413) / 2vous obtenez la moitié de la surface , mais pas nécessairement ce que vous recherchiez, ce qui est cependant une grande partie de la zone à mi-chemin horizontalement. Avec ce graphique, cette partie gauche de la division n'est pas la moitié de la zone - la ligne est en pente vers le bas (allant du haut à gauche au bas à droite), donc il y a plus d'espace dans la partie gauche que dans la partie droite. Si ce graphique était une ligne horizontale droite, la zone que vous séparez serait un rectangle et la moitié de la zone serait à mi-chemin.

rakslice
la source