Le kurtosis consiste à mesurer le pic et la planéité d'une distribution. La fonction de densité de la distribution, si elle existe, peut être considérée comme une courbe et présente des caractéristiques géométriques (telles que la courbure, la convexité, ...) liées à sa forme.
Je me demande donc si le kurtosis d'une distribution est lié à certaines caractéristiques géométriques de la fonction de densité, ce qui peut expliquer la signification géométrique du kurtosis?
Réponses:
Les moments d'une distribution continue, et leurs fonctions comme le kurtosis, en disent très peu sur le graphique de sa fonction de densité.
Considérez, par exemple, les graphiques suivants.
Chacun d'eux est le graphe d'une fonction non négative intégrant à : ce sont tous des PDF. De plus, ils ont tous exactement les mêmes moments - jusqu'au dernier nombre infini d'entre eux. Ainsi, ils partagent une kurtosis commune (qui se trouve être égale à - 3 + 3 e 2 + 2 e 3 + e 4. )1 - 3 + 3 e2+ 2 e3+ e4
Les formules de ces fonctions sont
pour - 1 ≤ s ≤ 1 , et k ∈ Z .x > 0 , - 1 ≤ s ≤ 1 , k ∈ Z .
La figure affiche les valeurs de à gauche et les valeurs de k en haut. La colonne de gauche montre le PDF pour la distribution log-normale standard.s k
L'exercice 6.21 de la Théorie avancée des statistiques de Kendall (Stuart & Ord, 5e édition) demande au lecteur de montrer que tous ces événements ont les mêmes moments.
On peut de même modifier n'importe quel pdf pour créer un autre pdf de forme radicalement différente mais avec les mêmes deuxième et quatrième moments centraux (disons), qui auraient donc le même kurtosis. À partir de cet exemple, il devrait être parfaitement clair que la kurtosis n'est pas une mesure facilement interprétable ou intuitive de symétrie, d'unimodalité, de bimodalité, de convexité ou de toute autre caractérisation géométrique familière d'une courbe.
Les fonctions des moments, donc (et kurtosis comme cas particulier) ne décrivent pas les propriétés géométriques du graphique du pdf. Cela a un sens intuitif: parce qu'un pdf représente la probabilité au moyen de l' aire, nous pouvons presque librement déplacer la densité de probabilité d'un endroit à un autre, modifiant radicalement l'apparence du pdf, tout en fixant un nombre fini de moments prédéfinis.
la source
Pour les distributions symétriques (c'est-à-dire celles pour lesquelles les moments centrés pairs sont significatifs), le kurtosis mesure une caractéristique géométrique du pdf sous-jacent. Il n'est pas vrai que le kurtosis mesure (ou soit en général lié) au pic d'une distribution. Au contraire, le kurtosis mesure à quel point la distribution sous-jacente est symétrique et bimodale (algébriquement, une distribution parfaitement symétrique et bimodale aura un kurtosis de 1, qui est la plus petite valeur possible que le kurtosis puisse avoir) [0].
En résumé [1], si vous définissez:
avec , puisE( X) = μ , V( X) = σ2
pour .Z= ( X- μ ) / σ
Cela implique que peut être considéré comme une mesure de la dispersion de Z 2 autour de son attente 1. En d'autres termes, si vous avez une interprétation géométrique de la variance et de l'espérance, celle du kurtosis suit.k Z2
[0] RB Darlington (1970). Kurtosis est-il vraiment un "pic"? Le statisticien américain, vol. 24, n ° 2.
[1] JJA Moors (1986). La signification de Kurtosis: Darlington Reexamined. The American Statistician, Volume 40, Numéro 4.
la source
[NB ceci a été écrit en réponse à une autre question sur place; les réponses ont été fusionnées à la présente question. C'est pourquoi cette réponse semble répondre à une question formulée différemment. Cependant, une grande partie du message devrait être pertinente ici.]
Kurtosis ne mesure pas vraiment la forme des distributions. Dans certaines familles de distribution, vous pouvez peut-être dire qu'il décrit la forme, mais plus généralement, le kurtosis ne vous dit pas grand-chose sur la forme réelle. La forme est influencée par de nombreuses choses, y compris des choses sans rapport avec le kurtosis.
Si l'on fait une recherche d'image pour kurtosis, plusieurs images comme celle-ci apparaissent:
qui semblent plutôt montrer une variance changeante, plutôt qu’augmenter le kurtosis. À titre de comparaison, voici trois densités normales que je viens de dessiner (en utilisant R) avec différents écarts-types:
Comme vous pouvez le voir, il semble presque identique à l'image précédente. Ils ont tous exactement le même kurtosis. En revanche, voici un exemple qui est probablement plus proche de ce que le diagramme visait
C'est généralement ce que les gens veulent dire quand ils parlent de kurtosis indiquant la forme de la densité. Cependant, le kurtosis peut être subtil - il ne doit pas fonctionner comme ça.
Par exemple, à une variance donnée, une kurtose plus élevée peut en fait se produire avec un pic plus faible.
Il faut aussi se méfier de la tentation (et dans de nombreux livres, il est ouvertement déclaré) que zéro excès de kurtosis implique la normalité. Il existe des distributions avec un excès de kurtosis 0 qui ne ressemblent en rien à la normale. Voici un exemple:
En effet, cela illustre également le point précédent. Je pourrais facilement construire une distribution d'apparence similaire avec une kurtosis plus élevée que la normale mais qui est toujours nulle au centre - une absence complète de pic.
Il existe un certain nombre de messages sur le site qui décrivent davantage la kurtosis. Un exemple est ici .
la source
Edit 23/11/2018: Depuis la rédaction de cet article, j'ai développé des perspectives géométriques sur le kurtosis. La première est que l'excès de kurtosis peut en effet être visualisé géométriquement en termes d'écarts par rapport à la ligne de 45 degrés attendue dans les queues du tracé quantile-quantile normal; voir Ce tracé QQ indique-t-il une distribution leptokurtique ou platykurtique?
la source
Un autre type de réponse: nous pouvons illustrer géométriquement le kurtosis, en utilisant les idées de http://www.quantdec.com/envstats/notes/class_06/properties.htm : moments graphiques.
Dans ce qui suit, je vais montrer un tracé de kurtosis graphique pour certaines distributions symétriques, toutes centrées sur zéro et mises à l'échelle pour avoir la variance 1.
Remarquez la quasi-absence de contribution au kurtosis du centre, montrant que le kurtosis n'a pas grand-chose à voir avec le "pic".
la source