Comme cela est bien connu pour la distribution normale, 68% de la masse de probabilité se situe dans un écart-type de la moyenne, 95% dans deux écarts-types et 99,7% dans 3 écarts-types.
Cependant, j'ai quelques distributions empiriques qui sont leptokurtiques et biaisées négativement. Dans de telles circonstances, existe-t-il une formule basée sur leurs moments d'ordre supérieur pour calculer la proportion de la masse de probabilité dans autant d'écarts-types de la moyenne?
J'ai une mesure et je voudrais donner une idée de sa distance par rapport au point médian (moyenne ou autre mesure de tendance centrale).
Cela peut-il être fait?
Réponses:
Vous pouvez toujours calculer le nombre de valeurs SD à partir de la moyenne en branchant simplement les valeurs d'échantillonnage, (valeur- moyenne) / SD, puis regroupement et comptage.
Des faits numériques précis tels que ceux que vous citez pour la normale (gaussienne) dépendent en général de la connaissance d'une ou plusieurs des fonctions de densité, de distribution ou de quantile, numériquement sinon analytiquement.
Cependant, il n'y a pas de relations générales disponibles sur la simple connaissance de l'asymétrie ou du kurtosis. L'asymétrie et le kurtosis ne précisent pas la forme de la distribution en général, car les moments plus élevés peuvent également varier.
la source
Voici une réponse précise qui montre que l'écart absolu médian par rapport à la moyenne n'est pas nécessairement lié à la kurtosis.
Considérons la famille de distributions deX= μ + σZ , où Z a la distribution discrète
La famille de distributions deX est indexé par trois paramètres: μ , σ , et θ , avec plages ( - ∞ , + ∞ ) , ( 0 , + ∞ ) et ( 0 , .5 ) .
Dans cette famille,E( X) = μ , Va r ( X) =σ2 , et l'écart absolu médian par rapport à la moyenne est 0,5 σ .
Le kurtosis deX est comme suit:
kurtosis= E(Z4) =.54∗ .5 +1.24∗ ( 0,5 - θ ) + ( 0,155 / θ + 1,44)2∗ θ .
Au sein de cette famille,
(i) le kurtosis tend vers l'infini lorsqueθ → 0 .
(ii) la répartition au sein des "épaules" (c'est-à-dire au seinμ ± σ est constante pour toutes les valeurs de kurtosis; ce sont simplement les deux pointsμ ± σ/ 2 , wp 0,25 chaque. Cela fournit un contre-exemple à une interprétation de la kurtosis, qui stipule qu'une plus grande kurtosis implique un mouvement de masse loin des épaules, simultanément dans la plage entre les épaules et dans les queues.
(iii) le "pic" de la distribution est également constant pour toutes les valeurs de kurtosis; encore une fois, ce sont simplement les deux pointsμ ± σ/ 2 , wp 0,25 chaque. Cela fournit un contre-exemple à l'interprétation souvent donnée mais manifestement incorrecte selon laquelle un kurtosis plus grand implique une distribution plus "maximale".
Dans cette famille, la partie centrale de la distribution devient plus plate à mesure que la kurtose augmente, car les probabilités surμ ± 1,2 σ et μ ± 0,5 σ converger vers la même valeur, 0,25 , à mesure que le kurtosis augmente.
(iv) l'écart absolu médian par rapport à la moyenne est constant,0,5 σ , pour toutes les valeurs de kurtosis.
la source