distribution t ayant une queue plus lourde que la distribution normale

10

Dans mes notes de cours, il est dit:

La distribution en t semble normale, mais avec des queues légèrement plus lourdes.

Je comprends pourquoi cela aurait l'air normal (à cause du théorème de la limite centrale). Mais j'ai du mal à comprendre comment prouver mathématiquement qu'il a des queues plus lourdes que la distribution normale et s'il existe un moyen de mesurer dans quelle mesure il est plus lourd que la distribution normale.

hmi2015
la source

Réponses:

12

La première chose à faire est de formaliser ce que nous entendons par "queue plus lourde". On pourrait théoriquement regarder à quel point la densité est élevée dans la queue extrême après avoir standardisé les deux distributions pour avoir le même emplacement et l'échelle (par exemple l'écart-type):

entrez la description de l'image ici
(à partir de cette réponse, qui est également quelque peu pertinente pour votre question )

[Dans ce cas, la mise à l'échelle n'a pas vraiment d'importance au final; le t sera toujours "plus lourd" que la normale même si vous utilisez des échelles très différentes; la normale descend toujours plus bas finalement]

Cependant, cette définition - bien qu'elle fonctionne bien pour cette comparaison particulière - ne se généralise pas très bien.

Plus généralement, une meilleure définition se trouve dans la réponse de whuber ici . Donc, si est plus lourd que , car devient suffisamment grand (pour tout certains ), alors , où , où est le cdf (pour plus lourd à droite; il y a une définition similaire et évidente de l'autre côté).YXtt>t0SY(t)>SX(t)S=1FF

entrez la description de l'image ici

Ici, c'est à l'échelle logarithmique et à l'échelle quantile de la normale, ce qui nous permet de voir plus en détail:

entrez la description de l'image ici

Ainsi, la "preuve" d'une plus grande finesse impliquerait de comparer les cdfs et de montrer que la queue supérieure du t-cdf finit toujours toujours au-dessus de celle de la normale et la queue inférieure du t-cdf finit toujours toujours en dessous de celle de la normale.

Dans ce cas, la chose la plus simple à faire est de comparer les densités et de montrer ensuite que la position relative correspondante des cdfs (/ fonctions de survivant) doit en découler.

Ainsi, par exemple, si vous pouvez faire valoir que (à un certain donné )ν

x2(ν+1)log(1+x2ν)>2log(k)

pour la constante nécessaire (une fonction de ), pour tout certains , alors il serait possible d'établir une queue plus lourde pour également sur la définition en termes de plus grand (ou plus grand sur la queue gauche).kνx>x0tν1FF

(cette forme résulte de la différence du log des densités, si cela tient la relation nécessaire entre les densités tient)

[Il est en fait possible de le montrer pour n'importe quel (pas seulement celui dont nous avons besoin provenant des constantes de normalisation de densité pertinentes), donc le résultat doit être valable pour le nous avons besoin.]kk

Glen_b -Reinstate Monica
la source
1
Un graphique avec (et peut-être en étendant un peu ) pourrait montrer les queues plus lourdes plus clairement, et pourrait également fonctionner avec des degrés de liberté plus élevés,logS(x)x
Henry
1
@Henry J'ai généré un tel complot mais je ne savais pas combien de valeur il a ajouté donc je ne l'ai pas inclus. Je vais penser à le mettre dedans.
Glen_b -Reinstate Monica
1
@Henry J'ai inclus l'intrigue.
Glen_b -Reinstate Monica
2

Une façon de voir la différence est d'utiliser des momentsE{xn}.

Des queues "plus lourdes" signifieront des valeurs plus élevées pour les moments de puissance pairs (puissance 4, 6, 8), lorsque la variance est la même. En particulier, le moment d'ordre 4 (autour de zéro) est appelé kurtosis et compare dans un certain sens la lourdeur des queues.

Voir Wikipedia pour plus de détails ( https://en.wikipedia.org/wiki/Kurtosis )

Dacian Bonta
la source
1
Bien que pour une distribution avec ou degrés de liberté, le kurtosis est infini, tandis qu'avec degrés de liberté, l'écart-type est infini, vous ne pouvez donc pas calculer le kurtosis, et avec degré de liberté, vous ne pouvez même pas calculer la moyenne ou le ème moment. t34214
Henry
3
@Henry Néanmoins, cette idée est bonne. L'élargissement du CDF de la distribution de Student autour de montre qu'il est asymptotiquement proportionnel à . Ainsi, tous les moments de poids absolus inférieurs à existent et tous les moments de poids absolus supérieurs à divergent. Avec la distribution normale, tous les moments absolus existent. Ceci fournit un ordre défini des queues de toutes les distributions Student et de la distribution normale. En effet, le paramètre fournit une réponse à la question d'origine sur la façon de mesurer la lourdeur d'une queue. t(ν)+xνννtν
whuber
2

Voici une preuve formelle basée sur les fonctions de survie. J'utilise la définition suivante de "queue plus lourde" inspirée de wikipedia :

Une variable aléatoire avec fonction de survie a des queues plus lourdes qu'une variable aléatoire avec fonction de survie siff YSy(t)XSx(t)

limtSy(t)Sx(t)=

Considérons une variable aléatoire distribuée comme t de Student avec zéro moyen, degrés de liberté et paramètre d'échelle . Nous comparons cela à la variable aléatoire . Pour les deux variables, les fonctions de survie sont différenciables. Donc, YνaXN(0,σ2)

limtSy(t)Sx(t)=limtfy(t)fx(t)=explimt(logfy(t)logfx(t))=explimt(ν+12log(1+t2νa2)(12σ2t2)+C)=exp(limtν+12log(1+t2νa2)(12σ2t2)+C)=exp(limt12σ2t2ν+12log(1+t2νa2)+C)=exp(12limua2σ2u(ν+1)log(1+uν)+C)=exp(12limuu(a2σ2(ν+1)log(1+uν)u+Cu))
Où nous avons substitué . Notez que est une constante, et D'où par théorème de limite algébrique, u=t2/a20<a2/σ2<limuC/u=0
limu(ν+1)log(1+uν)u=limu(ν+1)(1)(1+uν)(ν)=0
limtSy(t)Sx(t)=exp(12limuu(a2σ2(0)+(0)))=

Plus important encore, le résultat est valable pour les valeurs arbitraires (finies) de , et , de sorte que vous pouvez avoir des situations où, à la distribution, la variance est plus petite qu'une normale, mais toujours avec des queues plus lourdes.aσ2ν

Will Townes
la source
1
Juste une note que cette "définition" de queues plus lourdes n'est pas toujours acceptable. Par exemple, la distribution N (0,1), selon cette définition, a des queues plus lourdes que la distribution .9999 * U (-1,1) + .0001 * U (-1000, 1000), même si cette dernière distribution produit valeurs occasionnelles jusqu'à 175 écarts-types de la moyenne, malgré un support borné. Bien sûr, le N (0,1) produit également de telles valeurs, mais avec des probabilités bien inférieures à ce qui peut être considéré comme pertinent à des fins pratiques.
Peter Westfall