«Peakedness» d'une fonction de densité de probabilité asymétrique

11

Je voudrais décrire le "pic" et la "lourdeur" de la queue de plusieurs fonctions asymétriques de densité de probabilité.

Les caractéristiques que je veux décrire, seraient-elles appelées "kurtosis"? Je n'ai vu que le mot "kurtosis" utilisé pour les distributions symétriques?

user1375871
la source
15
En effet, les mesures de kurtosis sont généralement appliquées à des distributions symétriques. Vous pouvez également le calculer pour les asymétriques, mais l'interprétation change car cette valeur varie lorsque l'asymétrie est introduite. En fait, ces deux concepts sont difficiles à séparer. Récemment, une mesure de kurtosis invariante par rapport à l'asymétrie a été proposée dans cet article .
Un kurtosis élevé est associé à un pic et à une forte queue (il est également caractérisé comme un «manque d'épaules»). L'un des volumes de Kendall et Stuart discute longuement de ces questions. Mais de telles interprétations sont, comme vous le constatez, généralement données en situation de quasi-symétrie. Dans les cas non symétriques, le 4ème moment normalisé est généralement fortement corrélé avec le carré du troisième moment normalisé, ils mesurent donc essentiellement le même genre de chose.
Glen_b -Reinstate Monica
En effet, étant donné la façon particulière dont je l'ai formulé dans mon commentaire précédent, c'est vrai même pour les distributions symétriques - le carré du troisième moment standardisé de l'échantillon (asymétrie du moment carré) est fortement corrélé avec le quatrième moment standardisé de l'échantillon (`` kurtosis ''), même à dire la normale.
Glen_b -Reinstate Monica

Réponses:

3

La variance étant définie comme le deuxième moment , l'asymétrie étant définie comme le troisième moment et la kurtosis étant définie comme le quatrième moment , il est possible de décrire les propriétés d'un large éventail de distributions symétriques et non symétriques à partir des données. μ 3 μ 4μ2μ3μ4

Cette technique a été initialement décrite par Karl Pearson en 1895 pour les soi-disant distributions Pearson I à VII. Cela a été étendu par Egon S Pearson (date incertaine) tel que publié dans Hahn et Shapiro en 1966 à un large éventail de distributions symétriques, asymétriques et à queue lourde qui incluent Uniform, Normal, Students-t, Lognormal, Exponential, Gamma, Beta, Beta J et Beta U. D'après le tableau de la p. 197 de Hahn et Shapiro, et peuvent être utilisés pour établir des descripteurs d'asymétrie et de kurtosis comme: B 2B1B2

μ4=B2μ 2 2μ3=B1 μ23
μ4=B2 μ22

Si vous vouliez simplement des descripteurs relatifs simples, en appliquant une constante l'asymétrie est et le kurtosis est .μ2=1 B 2B1B2

Nous avons tenté de résumer ce tableau ici afin qu'il puisse être programmé, mais il vaut mieux le revoir dans Hahn et Shapiro (pp 42-49, 122-132, 197). Dans un sens, nous suggérons un peu de rétro-ingénierie du graphique Pearson, mais cela pourrait être un moyen de quantifier ce que vous recherchez.

AsymLabs
la source
3

La question principale ici est, qu'est-ce que le "pic"? S'agit-il d'une courbure au pic (dérivée 2ème?) Faut-il d'abord une standardisation? (On pourrait le penser, mais il existe un flux de littérature commençant par Proschan, Ann. Math. Statist. Volume 36, Number 6 (1965), 1703-1706, qui définit le pic d'une manière telle que la normale avec une variance plus petite est plus " pointu"). Ou est-ce une concentration de probabilité dans un écart-type de la moyenne, comme implicite dans Balanda et Macgillivray (The American Statistician, 1988, Vol 42, 111-119)? Une fois que vous vous êtes fixé une définition, il devrait être trivial de l'appliquer. Mais je demanderais, "pourquoi vous souciez-vous?" Quelle est la pertinence de la "crête", quelle que soit sa définition?

BTW, le kurtosis de Pearson ne mesure que les queues et ne mesure aucune des définitions de "pic" mentionnées ci-dessus. Vous pouvez modifier les données ou la distribution dans un écart-type de moyenne autant que vous le souhaitez (en gardant la contrainte moyenne = 0 et la variance = 1), mais le kurtosis ne peut changer que dans une plage maximale de 0,25 (généralement beaucoup moins). Vous pouvez donc exclure l'utilisation de kurtosis pour mesurer le pic pour toute distribution, même si le kurtosis est en effet une mesure des queues pour toute distribution, peu importe si la distribution est symétrique, asymétrique, discrète, continue, mélange discret / continu ou empirique. Kurtosis mesure les queues pour toutes les distributions, et pratiquement rien sur le pic (quelle que soit sa définition).

Peter Westfall
la source
1

Une approche très pratique possible pourrait être de calculer le rapport de la fonction de survie de la distribution sur la normale, montrant qu'elle est bien plus grande. Une autre approche peut être de calculer les ratios des centiles de la distribution sous intérêt et en la divisant par rapport aux valeurs normales d'un quantile, , . w 1 = ~ x 99 - ~ x 50Pr(X~>1α) ˜xw2=~Φ 99 -~Φ 50w1=x99~x50~x75~x50~x~ τ=w1w2=Φ99~Φ50~Φ75~Φ50~τ=w1w2

Giorgio Spedicato
la source
0

Je ne suis pas sûr de comprendre votre compréhension de l'apogée et de la lourdeur. Kurtosis signifie "Excès" en allemand, donc il décrit la "tête" ou le "pic" d'une distribution, décrivant si elle est très large ou très étroite. Wikipedia déclare que le "pic" est en fait décrit par le "kurtosis", alors que le pic ne semble pas être un vrai mot et vous devez utiliser le terme "Kurtosis".

Je pense donc que vous avez peut-être tout compris correctement, la tête est le Kurtosis, la "lourdeur" de la queue pourrait être l'asymétrie ":

Voici comment vous le trouvez:

a3=Σi=1N(xix¯)3Nsx3

avec s comme écart type pour x.

Les valeurs indiquent:

Inclinaison négative:

a3<0

Inclinaison positive:

a3>0

Pas de biais

a3=0

Vous pouvez obtenir une valeur pour le kurtosis avec:

a4=Σi=1N(xix¯)4Nsx4

Les valeurs indiquent:

Platycurtic:

a4<3

Leptocurtic:

a4>3

Normal:

a4=3.0

Cela vous a-t-il aidé?

Johannes Hofmeister
la source
3
Je crains que cette réponse dans sa forme actuelle ne soit moins utile en raison d'erreurs. L' asymétrie est une mesure standard de l' asymétrie . Elle n'est pas étroitement liée à la lourdeur des queues: il est possible que les queues soient extrêmement lourdes et que l'asymétrie soit nulle (ce qui est le cas pour toute distribution symétrique, par exemple). Veuillez également noter qu'il est impossible que soit négatif, donc la deuxième moitié de cette réponse n'a pas beaucoup de sens. (Peut-être avez-vous confondu kurtosis avec excès de kurtosis ?)a4
whuber
1
Merci d'avoir clarifié. Il pourrait en effet y avoir des erreurs dans les formules, je les ai juste copiées à partir des scripts qu'ils fournissent à uni. J'ai supervisé le fait que a4 ne peut pas être négatif.
Johannes Hofmeister
1
J'ai cherché pourquoi ma réponse était fausse - c'est une erreur de traduction, je m'en excuse. Mes diapositives sont toutes en allemand, mélangeant Kurtosis et Excess .
Johannes Hofmeister
@Peter Comme Peter Westfall le souligne sans cesse, votre commentaire est incorrect: le "pic" (de n'importe quel mode), considéré vaguement comme pointu ou hauteur, n'a absolument rien à voir avec les queues d'une distribution, ni mesuré par un quelconque fini combinaison de moments (comme le kurtosis). Cela peut être lié à la lourdeur des queues pour une famille de distributions, mais c'est une question complètement différente.
whuber
-1

Le kurtosis est définitivement associé au pic de la courbe. Je crois désormais que vous recherchez vraiment une kurtosis qui existe, que la distribution soit symétrique ou non. (user10525) l'a définitivement dit correctement! J'espère que votre problème est résolu maintenant. Partagez son résultat, toutes les opinions sont les bienvenues.

Vani
la source
1
Je ne sais pas en quoi cela constitue une réponse utile au-delà de ce qui a déjà été écrit ici. Et si vous développiez davantage la kurtosis et le pic de la courbe?
Momo
Je voulais clarifier clairement la requête. La discussion semble être déroutante @Momo
Vani