Asymétrie, kurtosis et combien de valeurs d'écarts-types par rapport à la moyenne

8

Comme cela est bien connu pour la distribution normale, 68% de la masse de probabilité se situe dans un écart-type de la moyenne, 95% dans deux écarts-types et 99,7% dans 3 écarts-types.

Cependant, j'ai quelques distributions empiriques qui sont leptokurtiques et biaisées négativement. Dans de telles circonstances, existe-t-il une formule basée sur leurs moments d'ordre supérieur pour calculer la proportion de la masse de probabilité dans autant d'écarts-types de la moyenne?

J'ai une mesure et je voudrais donner une idée de sa distance par rapport au point médian (moyenne ou autre mesure de tendance centrale).

Cela peut-il être fait?

Baz
la source
Sans quelques hypothèses supplémentaires, vous ne pouvez pas faire grand-chose. Voir, par exemple, les nombreux exemples de distributions avec la même asymétrie et kurtosis que la normale ici ; ils ont une grande variété de comportements quantiles différents (sans aucune tentative pour explorer l'étendue possible de ces comportements). Des effets similaires se produisent à d'autres valeurs d'asymétrie et de kurtosis.
Glen_b -Reinstate Monica

Réponses:

8

Vous pouvez toujours calculer le nombre de valeurs SD à partir de la moyenne en branchant simplement les valeurs d'échantillonnage, (valeur - moyenne) / SD, puis regroupement et comptage.

Des faits numériques précis tels que ceux que vous citez pour la normale (gaussienne) dépendent en général de la connaissance d'une ou plusieurs des fonctions de densité, de distribution ou de quantile, numériquement sinon analytiquement.

Cependant, il n'y a pas de relations générales disponibles sur la simple connaissance de l'asymétrie ou du kurtosis. L'asymétrie et le kurtosis ne précisent pas la forme de la distribution en général, car les moments plus élevés peuvent également varier.

Nick Cox
la source
0

Voici une réponse précise qui montre que l'écart absolu médian par rapport à la moyenne n'est pas nécessairement lié à la kurtosis.

Considérons la famille de distributions de X=μ+σZ, où Z a la distribution discrète

Z=-0,5, avec probabilité (wp) .25

=+0,5, wp .25

=-1.2, wp .25-θ/2

=+1.2, wp .25-θ/2

=-0,155/θ+1,44, wp θ/2

=+0,155/θ+1,44, wp θ/2.

La famille de distributions de X est indexé par trois paramètres: μ, σ, et θ, avec plages (-,+), (0,+) et (0,.5).

Dans cette famille, E(X)=μ, Vuner(X)=σ2, et l'écart absolu médian par rapport à la moyenne est 0,5σ.

Le kurtosis de X est comme suit:

kurtosis =E(Z4)=.54.5+1.24(.5-θ)+(0,155/θ+1,44)2θ.

Au sein de cette famille,

(i) le kurtosis tend vers l'infini lorsque θ0.

(ii) la répartition au sein des "épaules" (c'est-à-dire au sein μ±σest constante pour toutes les valeurs de kurtosis; ce sont simplement les deux pointsμ±σ/2, wp 0,25chaque. Cela fournit un contre-exemple à une interprétation de la kurtosis, qui stipule qu'une plus grande kurtosis implique un mouvement de masse loin des épaules, simultanément dans la plage entre les épaules et dans les queues.

(iii) le "pic" de la distribution est également constant pour toutes les valeurs de kurtosis; encore une fois, ce sont simplement les deux pointsμ±σ/2, wp 0,25chaque. Cela fournit un contre-exemple à l'interprétation souvent donnée mais manifestement incorrecte selon laquelle un kurtosis plus grand implique une distribution plus "maximale".

Dans cette famille, la partie centrale de la distribution devient plus plate à mesure que la kurtose augmente, car les probabilités sur μ±1.2σ et μ±0,5σ converger vers la même valeur, 0,25, à mesure que le kurtosis augmente.

(iv) l'écart absolu médian par rapport à la moyenne est constant, 0,5σ, pour toutes les valeurs de kurtosis.

Peter Westfall
la source