Regardez l'image ci-dessous. La ligne bleue indique le pdf normal standard. La zone rouge est censée être égale à la somme des zones grises (désolé pour un dessin horrible).
Je me demande si nous pouvons créer une nouvelle distribution avec un pic plus élevé en déplaçant les zones grises vers le haut (zone rouge) du pdf normal?
Si une telle transformation peut être faite, que pensez-vous du kurtosis de cette nouvelle distribution? Leptokurtic? Mais il a les mêmes queues que la distribution normale! Indéfini?
tail
Réponses:
Il y aura un nombre infini de distributions qui ressemblent beaucoup à votre dessin, avec une variété de valeurs différentes pour kurtosis.
Avec les conditions particulières de votre question et étant donné que nous maintenons le point de croisement à l'intérieur, ou du moins pas trop loin à l'extérieur±1 , cela devrait être le cas si vous obtenez un kurtosis légèrement plus grand que pour la normale. Je vais montrer trois cas où cela se produit, puis j'en montrerai un où il est plus petit - et expliquer les causes de ce phénomène.
Étant donné queϕ(x) et Φ(x) sont respectivement les pdf et cdf normaux standard, écrivons-nous une petite fonction
pour une densité symétrique continueg (avec cdf correspondant G ), avec moyenne 0 , tel que et .b =Φ ( t )-½-t . ϕ ( t )G ( t )-½-t . g( t ) a = ϕ ( t ) - b . g( t )
Autrement dit, et sont choisis pour rendre la densité continue et s'intégrer à .une b 1
Exemple 1 Considéronset,g(x)=3ϕ(3x) t = 1
qui ressemble à votre dessin, généré ici par le code R suivant:
Maintenant, les calculs. Faisons une fonction pour évaluer :XpF1( x )
afin que nous puissions évaluer les moments. D'abord la variance:
Ensuite le quatrième moment central:
Nous avons besoin du rapport de ces nombres, qui devrait avoir une précision d'environ 5 chiffres
Le kurtosis est donc d'environ 3,0955, légèrement plus grand que dans le cas normal.
Bien sûr, nous pourrions le calculer algébriquement et obtenir une réponse exacte, mais ce n'est pas nécessaire, cela nous dit ce que nous voulons savoir.
Exemple 2 Avec la fonctiondéfinie ci-dessus, nous pouvons l'essayer pour toutes sortes de.F g
Voici le Laplace:
Sans surprise, un résultat similaire.
Exemple 3 : Prenonspour une distribution de Cauchy (une distribution de Student-t avec 1 df), mais avec une échelle 2/3 (c'est-à-dire, siest un Cauchy standard,, et fixez à nouveau le seuil, t (en donnant les points,, en dehors desquels nous «passons» à la normale), à 1.g h ( x ) g( x ) = 1,5 h ( 1,5 x ) ± t
Et juste pour démontrer que nous avons effectivement une densité appropriée:
Exemple 4 : Que se passe-t-il quand on change t ?
Prenez et comme exemple précédent, mais changez le seuil en :g g t = 2
Comment cela peut-il arriver?
Eh bien, il est important de savoir que le kurtosis est (parlant légèrement lâche) 1+ la variance quadratique de :μ ± σ
Les trois distributions ont la même moyenne et la même variance.
La courbe noire est la densité normale standard. La courbe verte montre une distribution assez concentrée autour de (c'est-à-dire que la variance autour de est petite, conduisant à une kurtosis qui se rapproche de 1, la plus petite possible). La courbe rouge montre un cas où la distribution est "repoussée" de ; c'est le kurtosis est grand.μ ± σ μ ± σ μ ± σ
Dans cet esprit, si nous fixons les points de seuil suffisamment loin en dehors de nous pouvons pousser le kurtosis en dessous de 3 et avoir toujours un pic plus élevé.μ ± σ
la source
Kurtosis est un concept plutôt mal compris (je trouve que l'article de LT De Carlo "Sur la signification et l'utilisation de Kurtosis" (1997) est une discussion et une présentation sensées et précieuses des problèmes impliqués).
Je vais donc prendre la vue naïve, et je vais construire une densité,gX( x ) , avec "une valeur moyenne plus mince et plus élevée en mode", par rapport à la densité normale standard, mais des "queues" identiques avec cette dernière. Je ne prétends pas que cette densité présente un "kurtosis excessif".
Cette densité sera nécessairement échelonnée. Afin d'avoir des "queues" identiques à gauche et à droite, sa forme fonctionnelle pour les intervalles( - ∞ , - a ) et ( a , ∞ ) , où a > 0 , doit être identique à la normale standard ϕ ( x ) densité. Dans l'intervalle intermédiaire,( - a , a ) , il devrait avoir une autre forme fonctionnelle, appelez-le h ( x ) . Cetteh ( x ) doit être symétrique autour de zéro et satisfaire
1)h ( 0 ) > ϕ ( 0 ) = 1 /2 π--√ de sorte que la valeur de la densité dans le mode soit supérieure à la valeur de la normale standard, et
2)ϕ ( - a ) = h ( - a ) = h ( a ) = ϕ ( a ) pour que gX( x ) est continu.
De plus,gX( x ) devrait s'intégrer à l'unité sur le domaine, afin d'être une bonne densité. Cette densité sera donc
sous réserve des restrictions mentionnéesh ( x ) et aussi, sous réserve
ce qui équivaut à exiger que la masse de probabilité soush ( x ) dans l'intervalle ( - a , a ) doit être égal à la masse de probabilité sous ϕ ( x ) dans le même intervalle:
Pour obtenir quelque chose de spécifique, nous allons "essayer" la densité de la distribution de Laplace à moyenne nulle pourh ( x )
Pour satisfaire les différentes exigences fixées précédemment, nous devons avoir:
Pour une valeur plus élevée en mode,
Pour la continuité,
Ceci est un quadratiqueune . Son discriminant est
(on peut facilement vérifier qu'il est toujours positif). De plus, nous ne gardons que la racine positive puisquea > 0 donc
Enfin, l'exigence d'intégrer la densité à l'unité se traduit par
qui, par une intégration simple, conduit à
qui peut être résolu numériquement pourb∗ , et ainsi déterminer complètement la densité que nous recherchons.
Bien sûr, d'autres formes fonctionnelles symétriques autour de zéro pourraient être essayées, le pdf laplacien était juste à des fins d'exposition.
la source
Le kurtosis de cette distribution sera probablement plus élevé que celui d'une distribution normale. Je dis probablement parce que je fonde cela sur un dessin approximatif, et bien qu'il soit possible de prouver que le déplacement de la masse de cette manière augmente toujours le kurtosis, je ne suis pas positif à ce sujet.
Bien qu'il soit vrai qu'elle a les mêmes queues qu'une distribution normale, cette distribution aura une variance inférieure à la distribution normale dont elle est dérivée. Ce qui signifie que ses queues correspondront aux queues d'une certaine distribution normale, mais pas d'une distribution normale avec la même variance qu'elle. Ainsi, les queues normalisées seront en fait plus épaisses que les queues d'une distribution normale. Et, bien que des queues plus épaisses ne signifient pas automatiquement plus de kurtosis, dans ce cas, le quatrième moment normalisé sera probablement également plus grand.
la source
Il semble que l'OP essaie d'établir un lien entre le «pic» et le kurtosis en gardant les queues fixes et en rendant la distribution plus «pic». Il y a un effet sur le kurtosis ici, mais il est si léger qu'il ne vaut guère la peine d'être mentionné. Voici un théorème pour soutenir cette affirmation.
Théorème 1: Considérons toute distribution de probabilité avec un quatrième moment fini. Construisez une nouvelle distribution de probabilité en remplaçant la masse[ μ - σ, μ + σ] gamme, en gardant la masse en dehors de [ μ - σ, μ + σ] fixe et en maintenant l'écart moyen et standard à μ , σ . Ensuite, la différence entre les valeurs minimale et maximale du moment de kurtosis de Pearson sur tous ces remplacements est≤ 0,25 .
Commentaire: La preuve est constructive; vous pouvez réellement identifier les remplacements de kurtosis min et max dans ce paramètre. En outre, 0,25 est une limite supérieure sur la plage de kurtosis, selon la distribution. Par exemple, avec une distribution normale, la limite de plage est de 0,141, plutôt que de 0,25.
D'un autre côté, il y a un effet énorme des queues sur le kurtosis, comme le donne le théorème suivant:
Théorème 2: Considérons toute distribution de probabilité avec un quatrième moment fini. Construisez une nouvelle distribution de probabilité en remplaçant la masse en dehors de la[ μ - σ, μ + σ] gamme, en gardant la masse [ μ - σ, μ + σ] fixe et en maintenant l'écart moyen et standard à μ , σ . Ensuite, la différence entre les valeurs minimale et maximale du moment de kurtosis de Pearson sur tous ces remplacements est illimitée; c'est-à-dire que la nouvelle distribution peut être choisie de sorte que la kurtosis soit aribitrairement grande.
Commentaire: Ces deux théorèmes montrent que l'effet des queues sur le kurtosis du moment de Pearson est infini, tandis que l'effet du "pic" est≤ 0,25 .
la source