Que dit l'écart type en distribution non normale

40

Dans une distribution normale, la règle 68-95-99.7 attribue beaucoup de signification à l'écart-type, mais que signifierait-il par déviation dans une distribution non normale (multimodale ou asymétrique)? Toutes les valeurs de données resteraient-elles toujours dans les 3 écarts types? Avons-nous des règles comme celle 68-95-99.7 pour les distributions non normales?

Zuhaib Ali
la source
16
Regardez l'inégalité de Chebyshev .
COOLSerdash
@ COOLSerdash super. Cela répond parfaitement à ma question.
Zuhaib Ali
3
Le point de @ COOLSerdash est bien ciblé ici, mais sachez que l'affirmation standard de l'inégalité de Chebyshev se rapporte au véritable DS connu à priori, et non à un SD estimé à partir de votre échantillon. Il peut être utile de lire cet excellent fil de CV: Existe-t-il un exemple de l’inégalité unilatérale de Chebeshev?
Gay - Rétablir Monica
En outre, vous ne devriez probablement pas vous contenter de Chebyshev tout de suite - vous pouvez probablement faire beaucoup mieux, que ce soit biaisé ou non.
Steve S
1
@gung fait de même la règle 68-95-99.7!
Glen_b -Reinstate Monica

Réponses:

12

L’écart type est une mesure particulière de la variation. Il y en a plusieurs autres. La déviation absolue moyenne est assez populaire. L'écart-type n'est en aucun cas spécial. Ce qui le rend spécial, c'est que la distribution gaussienne est spéciale.

Comme indiqué dans les commentaires, l'inégalité de Chebyshev est utile pour avoir un sentiment. Cependant, il y en a plus .

Keith
la source
9

C'est la racine carrée du deuxième moment central , la variance. Les moments sont liés à des fonctions caractéristiques (CF), appelées caractéristiques pour la raison qu’elles définissent la distribution de probabilité. Donc, si vous connaissez tous les moments, vous connaissez CF, vous connaissez donc toute la distribution de probabilité.

La fonction caractéristique de la distribution normale est définie par deux moments seulement: la moyenne et la variance (ou écart-type). Par conséquent, pour une distribution normale, l’écart type est particulièrement important, c’est 50% de sa définition.

Pour d'autres distributions, l'écart-type est à certains égards moins important car elles ont d'autres moments. Cependant, pour de nombreuses distributions utilisées dans la pratique, les premiers instants sont les plus grands et sont donc les plus importants à connaître.

Maintenant, intuitivement, la moyenne vous indique le centre de votre distribution, tandis que l’écart-type vous indique à quel point vos données sont proches de ce centre.

Puisque l'écart-type est exprimé en unités de la variable, il est également utilisé pour mettre à l'échelle d'autres moments afin d'obtenir des mesures telles que kurtosis. . Kurtosis est une métrique sans dimension qui vous indique à quel point les queues de votre distribution sont grasses par rapport à la normale

Aksakal
la source
1
"Maintenant, intuitivement, la moyenne vous indique le centre de votre distribution, tandis que l'écart-type vous indique à quel point vos données sont proches de ce centre." - Cela ne s’applique-t-il que si la distribution est normale? Sinon, plus souvent qu'autrement, la médiane est une meilleure mesure de la tendance centrale.
Dan Temkin
@DanTemkin Lorsque vous utilisez la médiane, l'écart type perd sa valeur d'un degré. C'est calculé à partir de la moyenne. Avec la médiane, il est logique de parler de quantiles, ce qui pourrait être un moyen d’aller de l’avant avec des distributions asymétriques. OP ne s'est cependant pas concentré sur des distributions asymétriques. Donc, pour toute distribution symétrique vous avez moyenne = médiane, elle n’a pas à être normale. Il est donc logique de parler de moyenne lorsque l’écart type est discuté.
Aksakal
4

L'écart-type d'échantillon est une mesure de la déviance des valeurs observées par rapport à la moyenne, dans les mêmes unités pour mesurer les données. Distribution normale ou pas.

Alexis
la source