La première chose à faire est de formaliser ce que nous entendons par "queue plus lourde". On pourrait théoriquement regarder à quel point la densité est élevée dans la queue extrême après avoir standardisé les deux distributions pour avoir le même emplacement et l'échelle (par exemple l'écart-type):
(à partir de cette réponse, qui est également quelque peu pertinente pour votre question )
[Dans ce cas, la mise à l'échelle n'a pas vraiment d'importance au final; le t sera toujours "plus lourd" que la normale même si vous utilisez des échelles très différentes; la normale descend toujours plus bas finalement]
Cependant, cette définition - bien qu'elle fonctionne bien pour cette comparaison particulière - ne se généralise pas très bien.
Plus généralement, une meilleure définition se trouve dans la réponse de whuber ici . Donc, si est plus lourd que , car devient suffisamment grand (pour tout certains ), alors , où , où est le cdf (pour plus lourd à droite; il y a une définition similaire et évidente de l'autre côté).YXtt>t0SY(t)>SX(t)S=1−FF
Ici, c'est à l'échelle logarithmique et à l'échelle quantile de la normale, ce qui nous permet de voir plus en détail:
Ainsi, la "preuve" d'une plus grande finesse impliquerait de comparer les cdfs et de montrer que la queue supérieure du t-cdf finit toujours toujours au-dessus de celle de la normale et la queue inférieure du t-cdf finit toujours toujours en dessous de celle de la normale.
Dans ce cas, la chose la plus simple à faire est de comparer les densités et de montrer ensuite que la position relative correspondante des cdfs (/ fonctions de survivant) doit en découler.
Ainsi, par exemple, si vous pouvez faire valoir que (à un certain donné )ν
x2−(ν+1)log(1+x2ν)>2⋅log(k)†
pour la constante nécessaire (une fonction de ), pour tout certains , alors il serait possible d'établir une queue plus lourde pour également sur la définition en termes de plus grand (ou plus grand sur la queue gauche).kνx>x0tν1−FF
† (cette forme résulte de la différence du log des densités, si cela tient la relation nécessaire entre les densités tient)
[Il est en fait possible de le montrer pour n'importe quel (pas seulement celui dont nous avons besoin provenant des constantes de normalisation de densité pertinentes), donc le résultat doit être valable pour le nous avons besoin.]kk
Une façon de voir la différence est d'utiliser des momentsE{xn}.
Des queues "plus lourdes" signifieront des valeurs plus élevées pour les moments de puissance pairs (puissance 4, 6, 8), lorsque la variance est la même. En particulier, le moment d'ordre 4 (autour de zéro) est appelé kurtosis et compare dans un certain sens la lourdeur des queues.
Voir Wikipedia pour plus de détails ( https://en.wikipedia.org/wiki/Kurtosis )
la source
Voici une preuve formelle basée sur les fonctions de survie. J'utilise la définition suivante de "queue plus lourde" inspirée de wikipedia :
Une variable aléatoire avec fonction de survie a des queues plus lourdes qu'une variable aléatoire avec fonction de survie siffY Sy(t) X Sx(t)
Considérons une variable aléatoire distribuée comme t de Student avec zéro moyen, degrés de liberté et paramètre d'échelle . Nous comparons cela à la variable aléatoire . Pour les deux variables, les fonctions de survie sont différenciables. Donc,Y ν a X∼N(0,σ2)
Plus important encore, le résultat est valable pour les valeurs arbitraires (finies) de , et , de sorte que vous pouvez avoir des situations où, à la distribution, la variance est plus petite qu'une normale, mais toujours avec des queues plus lourdes.a σ2 ν
la source