Intuition derrière la fonction de densité des distributions t

12

J'étudie la distribution t de Student et j'ai commencé à me demander comment dériverait la fonction de densité des distributions t (de wikipedia, http://en.wikipedia.org/wiki/Student%27s_t-distribution ):

f(t)=Γ(v+12)vπΓ(v2)(1+t2v)v+12

est le degré de liberté et Γ est la fonction gamma. Quelle est l'intuition de cette fonction? Je veux dire, si je regarde la fonction de masse de probabilité de la distribution binomiale, cela a du sens pour moi. Mais la fonction de densité des distributions t n'a aucun sens pour moi ... elle n'est pas intuitive du tout à première vue. Ou l'intuition est-elle juste qu'elle a une courbe en forme de cloche et qu'elle répond à nos besoins?vΓ

Merci pour toute aide :)

jjepsuomi
la source
3
Cette distribution a une interprétation géométrique simple (et jolie). En effet, bien que Student (1908) ait d'abord dérivé cette forme du PDF par une supposition intelligente (soutenue par la simulation de Monte-Carlo), Fisher (c. 1920) l'a d'abord obtenue avec un argument géométrique. L'essentiel est que décrit la distribution du rapport de la hauteur d'un (point uniformément distribué) sur la sphère ν + 1 et son rayon (distance de l'axe): en d'autres termes, la tangente de sa latitude. Un compte de ceci est fourni à evolvedmicrobe.com/Literature/GeometricTDistribution.pdf . fν+1
whuber

Réponses:

9

Si vous avez une variable aléatoire normale standard, , et une variable aléatoire khi carré indépendante Q avec ν df, alorsZQν

T=Z/Q/ν

a une distribution avec ν df. (Je ne suis pas sûr de la distribution de Z / Q , mais ce n'est pas t .)tνZ/Qt

La dérivation réelle est un résultat assez standard. Alecos le fait de deux manières ici .

ν

entrez la description de l'image ici

Q/νtZQ/νtZtZ

tQ/νt

entrez la description de l'image ici

(le «relativement plus élevé» entraîne un pic légèrement plus net par rapport à l'écart, mais la plus grande variance tire le centre vers le bas, ce qui signifie que le pic est légèrement plus bas avec un df plus faible)

t

Glen_b -Reinstate Monica
la source
1
J'étais un peu bâclé dans mon explication. Bien sûr, il s'agissait de la racine carrée de la variable aléatoire distribuée du chi carré divisée par ses degrés de liberté.
Analyste
@Analyst J'ai fait la même chose moi-même, plus d'une fois.
Glen_b -Reinstate Monica
9

La réponse de Glen est correcte, mais d'un point de vue bayésien, il est également utile de considérer la distribution t comme un mélange continu de distributions normales avec différentes variances. Vous pouvez trouver la dérivation ici:

Student t as mixture of gaussian

Je pense que cette approche aide votre intuition car elle clarifie la façon dont la distribution t se produit lorsque vous ne connaissez pas la variabilité exacte de votre population.

Erik
la source
2
J'ai fait une animation de la distribution t comme un mélange de distributions normales ici: sumsar.net/blog/2013/12/t-as-a-mixture-of-normals
Rasmus Bååth