Intuition derrière la fonction de densité des distributions t

12

J'étudie la distribution t de Student et j'ai commencé à me demander comment dériverait la fonction de densité des distributions t (de wikipedia, http://en.wikipedia.org/wiki/Student%27s_t-distribution ):

f (t) = \frac{Γ (\frac{v + 1}{2})}{\sqrt{v π} Γ (\frac{v}{2})} {(1 + \frac{t^{2}}{v})}^{- \frac{v + 1}{2}}

$f(t) = \frac{\Gamma(\frac{v+1}{2})}{\sqrt{v\pi}\:\Gamma(\frac{v}{2})}\left(1+\frac{t^2}{v} \right)^{-\frac{v+1}{2}}$

où est le degré de liberté et est la fonction gamma. Quelle est l'intuition de cette fonction? Je veux dire, si je regarde la fonction de masse de probabilité de la distribution binomiale, cela a du sens pour moi. Mais la fonction de densité des distributions t n'a aucun sens pour moi ... elle n'est pas intuitive du tout à première vue. Ou l'intuition est-elle juste qu'elle a une courbe en forme de cloche et qu'elle répond à nos besoins? $v$ $\Gamma$

Merci pour toute aide :)

probability normal-distribution t-distribution jjepsuomi
la source

3

Cette distribution a une interprétation géométrique simple (et jolie). En effet, bien que Student (1908) ait d'abord dérivé cette forme du PDF par une supposition intelligente (soutenue par la simulation de Monte-Carlo), Fisher (c. 1920) l'a d'abord obtenue avec un argument géométrique. L'essentiel est que

décrit la distribution du rapport de la hauteur d'un (point uniformément distribué) sur la sphère

et son rayon (distance de l'axe): en d'autres termes, la tangente de sa latitude. Un compte de ceci est fourni à evolvedmicrobe.com/Literature/GeometricTDistribution.pdf .

f

$f$

ν + 1

$\nu+1$

whuber

9

Si vous avez une variable aléatoire normale standard, , et une variable aléatoire khi carré indépendante avec df, alors $Z$ $Q$ $\nu$

$T = Z/\sqrt{Q/\nu}$

a une distribution avec df. (Je ne suis pas sûr de la distribution de , mais ce n'est pas .) $t$ $\nu$ $Z/Q$ $t$

La dérivation réelle est un résultat assez standard. Alecos le fait de deux manières ici .

$\sqrt \nu$

entrez la description de l'image ici

$\sqrt{Q/\nu}$ $t$ $Z$ $\sqrt{Q/\nu}$ $t$ $Z$ $t$ $Z$

$t$ $\sqrt{Q/\nu}$ $t$

entrez la description de l'image ici

(le «relativement plus élevé» entraîne un pic légèrement plus net par rapport à l'écart, mais la plus grande variance tire le centre vers le bas, ce qui signifie que le pic est légèrement plus bas avec un df plus faible)

$t$

Glen_b -Reinstate Monica
la source

1

J'étais un peu bâclé dans mon explication. Bien sûr, il s'agissait de la racine carrée de la variable aléatoire distribuée du chi carré divisée par ses degrés de liberté.

Analyste

@Analyst J'ai fait la même chose moi-même, plus d'une fois.

Glen_b -Reinstate Monica

9

La réponse de Glen est correcte, mais d'un point de vue bayésien, il est également utile de considérer la distribution t comme un mélange continu de distributions normales avec différentes variances. Vous pouvez trouver la dérivation ici:

Student t as mixture of gaussian

Je pense que cette approche aide votre intuition car elle clarifie la façon dont la distribution t se produit lorsque vous ne connaissez pas la variabilité exacte de votre population.

Erik
la source

2

J'ai fait une animation de la distribution t comme un mélange de distributions normales ici: sumsar.net/blog/2013/12/t-as-a-mixture-of-normals

Rasmus Bååth

Intuition derrière la fonction de densité des distributions t

Réponses: