Je voudrais décrire le "pic" et la "lourdeur" de la queue de plusieurs fonctions asymétriques de densité de probabilité.
Les caractéristiques que je veux décrire, seraient-elles appelées "kurtosis"? Je n'ai vu que le mot "kurtosis" utilisé pour les distributions symétriques?
pdf
descriptive-statistics
skewness
kurtosis
user1375871
la source
la source
Réponses:
La variance étant définie comme le deuxième moment , l'asymétrie étant définie comme le troisième moment et la kurtosis étant définie comme le quatrième moment , il est possible de décrire les propriétés d'un large éventail de distributions symétriques et non symétriques à partir des données. μ 3 μ 4μ2 μ3 μ4
Cette technique a été initialement décrite par Karl Pearson en 1895 pour les soi-disant distributions Pearson I à VII. Cela a été étendu par Egon S Pearson (date incertaine) tel que publié dans Hahn et Shapiro en 1966 à un large éventail de distributions symétriques, asymétriques et à queue lourde qui incluent Uniform, Normal, Students-t, Lognormal, Exponential, Gamma, Beta, Beta J et Beta U. D'après le tableau de la p. 197 de Hahn et Shapiro, et peuvent être utilisés pour établir des descripteurs d'asymétrie et de kurtosis comme: B 2B1 B2
μ4=B2μ 2 2μ3= B1 μ32-----√
μ4= B2 μ22
Si vous vouliez simplement des descripteurs relatifs simples, en appliquant une constante l'asymétrie est et le kurtosis est .√μ2= 1 B 2B1---√ B2
Nous avons tenté de résumer ce tableau ici afin qu'il puisse être programmé, mais il vaut mieux le revoir dans Hahn et Shapiro (pp 42-49, 122-132, 197). Dans un sens, nous suggérons un peu de rétro-ingénierie du graphique Pearson, mais cela pourrait être un moyen de quantifier ce que vous recherchez.
la source
La question principale ici est, qu'est-ce que le "pic"? S'agit-il d'une courbure au pic (dérivée 2ème?) Faut-il d'abord une standardisation? (On pourrait le penser, mais il existe un flux de littérature commençant par Proschan, Ann. Math. Statist. Volume 36, Number 6 (1965), 1703-1706, qui définit le pic d'une manière telle que la normale avec une variance plus petite est plus " pointu"). Ou est-ce une concentration de probabilité dans un écart-type de la moyenne, comme implicite dans Balanda et Macgillivray (The American Statistician, 1988, Vol 42, 111-119)? Une fois que vous vous êtes fixé une définition, il devrait être trivial de l'appliquer. Mais je demanderais, "pourquoi vous souciez-vous?" Quelle est la pertinence de la "crête", quelle que soit sa définition?
BTW, le kurtosis de Pearson ne mesure que les queues et ne mesure aucune des définitions de "pic" mentionnées ci-dessus. Vous pouvez modifier les données ou la distribution dans un écart-type de moyenne autant que vous le souhaitez (en gardant la contrainte moyenne = 0 et la variance = 1), mais le kurtosis ne peut changer que dans une plage maximale de 0,25 (généralement beaucoup moins). Vous pouvez donc exclure l'utilisation de kurtosis pour mesurer le pic pour toute distribution, même si le kurtosis est en effet une mesure des queues pour toute distribution, peu importe si la distribution est symétrique, asymétrique, discrète, continue, mélange discret / continu ou empirique. Kurtosis mesure les queues pour toutes les distributions, et pratiquement rien sur le pic (quelle que soit sa définition).
la source
Une approche très pratique possible pourrait être de calculer le rapport de la fonction de survie de la distribution sur la normale, montrant qu'elle est bien plus grande. Une autre approche peut être de calculer les ratios des centiles de la distribution sous intérêt et en la divisant par rapport aux valeurs normales d'un quantile, , . w 1 = ~ x 99 - ~ x 50Pr(X~>1−α) ˜xw2=~Φ 99 -~Φ 50w1=x99~−x50~x75~−x50~ x~ τ=w1w2=Φ99~−Φ50~Φ75~−Φ50~ τ=w1w2
la source
Je ne suis pas sûr de comprendre votre compréhension de l'apogée et de la lourdeur. Kurtosis signifie "Excès" en allemand, donc il décrit la "tête" ou le "pic" d'une distribution, décrivant si elle est très large ou très étroite. Wikipedia déclare que le "pic" est en fait décrit par le "kurtosis", alors que le pic ne semble pas être un vrai mot et vous devez utiliser le terme "Kurtosis".
Je pense donc que vous avez peut-être tout compris correctement, la tête est le Kurtosis, la "lourdeur" de la queue pourrait être l'asymétrie ":
Voici comment vous le trouvez:
avec s comme écart type pour x.
Les valeurs indiquent:
Inclinaison négative:
Inclinaison positive:
Pas de biais
Vous pouvez obtenir une valeur pour le kurtosis avec:
Les valeurs indiquent:
Platycurtic:
Leptocurtic:
Normal:
Cela vous a-t-il aidé?
la source
Le kurtosis est définitivement associé au pic de la courbe. Je crois désormais que vous recherchez vraiment une kurtosis qui existe, que la distribution soit symétrique ou non. (user10525) l'a définitivement dit correctement! J'espère que votre problème est résolu maintenant. Partagez son résultat, toutes les opinions sont les bienvenues.
la source