Exemple de distribution à queue lourde qui n'est pas à longue queue

14

D'après les lectures sur les distributions à queue longue et à queue longue, j'ai compris que toutes les distributions à queue longue sont à queue longue , mais toutes les distributions à queue lourde ne sont pas à queue longue .

Quelqu'un pourrait-il donner un exemple de:

  • une fonction de densité continue, symétrique et à moyenne nulle à longue queue
  • une fonction de densité continue, symétrique et à moyenne nulle qui est à queue lourde mais pas à longue queue

donc je peux mieux comprendre le sens de leurs définitions?

Ce serait encore mieux si les deux pouvaient avoir une variance unitaire.

toliveira
la source
2
Où avez-vous trouvé ces définitions? Pouvez-vous les donner ici? Je les ai considérés comme des synonymes!
kjetil b halvorsen
@kjetilbhalvorsen: Peut-être ici: en.wikipedia.org/wiki/…
Scortchi
@kjetilbhalvorsen SA: Voir, lien E. LA: J'étudiais les définitions des distributions "lourde", "grasse" et "à longue queue", et j'ai trouvé des explications utiles sur: (A) [ stats.stackexchange.com/ questions / 10726 /… , (B) [ en.wikipedia.org/wiki/Heavy-tailed_distribution] , (C) [ users.cms.caltech.edu/~adamw/papers/… , (suite)
toliveira
(suite) (E) math.stackexchange.com/questions/685921/… J'ai compris que (i) la distribution à queue lourde est définie comme dans A, B, C, D, E, (ii) la distribution à longue queue est définie comme dans B, C, E (iii) la définition de queue grasse est lâche, comme expliqué dans A.
toliveira

Réponses:

16

Les deux définitions sont proches, mais pas exactement les mêmes. Une différence réside dans la nécessité pour le taux de survie d'avoir une limite.

Pour la plupart de cette réponse, j'ignorerai les critères pour que la distribution soit continue, symétrique et de variance finie, car ceux-ci sont faciles à accomplir une fois que nous avons trouvé une distribution à queue lourde à variance finie qui n'est pas à queue longue.


Une distribution est à queue lourde lorsque pour tout t > 0 ,Ft>0

(1)RetxdF(x)=.

Une distribution avec fonction de survie est à longue queue lorsqueGF=1F

(2)limxGF(x+1)GF(x)=1.

Les distributions à longue queue sont lourdes. De plus, comme n'est pas croissant, la limite du rapport ( 2 ) ne peut pas dépasser 1 . S'il existe et est inférieur à 1 , alors G diminue exponentiellement - et cela permettra l'intégrale ( 1 )G(2)11G(1) de converger.

La seule façon de montrer une distribution à queue lourde qui n'est pas à longue queue, alors, est de modifier une distribution à longue queue pour que continue de tenir tandis que ( 2 ) est violé. Il est facile de bousiller une limite: changez-la dans une infinité d'endroits qui divergent à l'infini. Cela prendra cependant du temps avec F , qui doit rester croissant et cadlag. Une façon consiste à introduire des sauts vers le haut dans F , ce qui fera sauter G vers le bas, abaissant le rapport G F ( x + 1 ) / G F ( x )(1)(2)FFGGF(x+1)/GF(x) . A cette fin, définissons une transformation Tu qui transforme en une autre fonction de distribution valide tout en créant un saut soudain à la valeur u , disons un saut à mi-chemin de F ( u ) à 1 :FuF(u)1

Tu[F](x)={F(x)u<x12(1F(x))+F(x)ux

Cela ne modifie aucune propriété de base de : TFTu[F] is still a distribution function.

The effect on GF is to make it drop by a factor of 1/2 at u. Therefore, since G is non-decreasing, then whenever u1x<u,

GTu[F](x+1)GTu[F](x)12.

If we pick an increasing and diverging sequence of ui, i=1,2,, and apply each Tui in succession, it determines a sequence of distributions Fi with F0=F and

Fi+1=Tui[Fi]

for i1. After the ith step, Fi(x),Fi+1(x), all remain the same for x<ui. Consequently the sequence of Fi(x) is a nondecreasing, bounded, pointwise sequence of distribution functions, implying its limit

F=limiFi

is a distribution function. By construction, it is not long-tailed because there are infinitely many points at which its survival ratio GF(x+1)/GF(x)) drops to 1/2 or below, showing it cannot have 1 as a limit.

Figure 1: An altered survival function

This plot shows a survival function G(x)=x1/5 that has been cut down in this manner at points u112.9,u240.5,u3101.6,. Note the logarithmic vertical axis.

The hope is to be able to choose (ui) so that F remains heavy-tailed. We know, because F is heavy-tailed, that there are numbers 0=u0<u1<u2<<un for which

ui1uiex/idF(x)2i1

for every i1. The reason for the 2i1 on the right is that the probabilities assigned by F to values up to ui have been successively cut in half i1 times. That procedure, when dF(x) is replaced by dFj(x) for any ji, will reduce 2i1 to 1, but no lower.

Figure 2: A cut-down density function

This is a plot of xf(x) for densities f corresponding to the previous survival function and its "cut down" version. The areas under this curve contribute to the expectation. The area from 1 to u1 is 1; the area from u1 to u2 is 2, which when cut down (to the lower blue portion) becomes an area of 1; the area from u2 to u3 is 4, which when cut down becomes an area of 1, and so on. Thus, the area under each successive "stair step" to the right is 1.

Let us pick such a sequence (ui) to define F. We can check that it remains heavy-tailed by picking t=1/n for some whole number n and applying the construction:

RetxdF(x)=Rex/ndF(x)=i=1ui1uiex/ndF(x)i=n+1ui1uiex/ndF(x)i=n+1ui1uiex/idF(x)=i=n+1ui1uiex/idFi(x)i=n+11,

which still diverges. Since t is arbitrarily small, this demonstrates that F remains heavy-tailed, even though its long-tailed property has been destroyed.

Figure 3: plot of G(1+x)/G(x)

This is a plot of the survival ratio G(x+1)/G(x) for the cut down distribution. Like the ratio of the original G, it tends toward an upper accumulation value of 1--but for unit-width intervals terminating at the ui, the ratio suddenly drops to only half of what it originally was. These drops, although becoming less and less frequent as x increases, occur infinitely often and therefore prevent the ratio from approaching 1 in the limit.


If you would like a continuous, symmetric, zero-mean, unit-variance example, begin with a finite-variance long-tailed distribution. F(x)=1xp (for x>0) will do, provided p>1; so would a Student t distribution for any degrees of freedom exceeding 2. The moments of F cannot exceed those of F, whence it too has finite variance. "Mollify" it via convolution with a nice smooth distribution, such as a Gaussian: this will make it continuous but will not destroy its heavy tail (obviously) nor the absence of a long tail (not quite as obvious, but it becomes obvious if you change the Gaussian to, say, a Beta distribution whose support is compact).

Symmetrize the result--which I will still call F--by defining

Fs(x)=12(1+sgn(x)F(|x|))

for all xR. Its variance will remain finite, so it can be standardized to the desired distribution.

whuber
la source
2
Brilliantly explained. You offered not just an example but also the justification for it. The clarity of the explanation allowed me to understand (almost) the whole of it. I will practice it in some numerical examples.
toliveira