Soit tiré iid d'une distribution de Student t avec degrés de liberté, pour taille moyenne (disons inférieure à 100). Définir est-il distribué presque comme un chi carré avec degrés de liberté? Existe-t-il quelque chose comme le théorème de la limite centrale pour la somme des variables aléatoires au carré?
chi-squared
central-limit-theorem
t-distribution
shabbychef
la source
la source
Réponses:
Répondre à la première question.
On pourrait partir du fait noté par mpiktas, quet2∼F(1,n) . Et puis essayez une étape plus simple dans un premier temps - recherchez la distribution d'une somme de deux variables aléatoires distribuées par . Cela pourrait se faire soit en calculant la convolution de deux variables aléatoires, soit en calculant le produit de leurs fonctions caractéristiques.F(1,n)
L' article de PCB Phillips montre que ma première estimation des «fonctions hypergéométriques [confluentes] impliquées» était en effet vraie. Cela signifie que la solution ne sera pas anodine et que la force brute est compliquée, mais condition nécessaire pour répondre à votre question. Donc, puisque est fixe et que vous résumez les distributions t, nous ne pouvons pas dire avec certitude quel sera le résultat final. Sauf si quelqu'un a une bonne habileté à jouer avec les produits des fonctions hypergéométriques confluentes.n
la source
Ce n'est même pas une approximation rapprochée. Pour les petitsn , l'espérance de T est égale à alors que l'espérance deχ2(k)est égale àk. Lorsquekest petit (moins de 10, disons), les histogrammes delog(T)et delog(χ2(k))n'ont même pas la même forme, ce qui indique que le décalage et le redimensionnementknn−2 χ2(k) k k log(T) log(χ2(k)) ne fonctionneront toujours pas.T
Intuitivement, pour de petits degrés de liberté Le de Student est à queue lourde. La quadrature accentue cette lourdeur. Les sommes seront donc plus asymétriques - généralement beaucoup plus asymétriques - que les sommes des normales au carré (le χ 2t χ2 distribution ). Les calculs et les simulations le confirment.
Illustration (comme demandé)
Chaque histogramme représente une simulation indépendante de 100 000 essais avec les degrés de liberté ( ) et les sommets ( k ) spécifiés , normalisés comme décrit par @mpiktas. La valeur de n = 9999 sur la ligne du bas se rapproche du cas χ 2 . Ainsi, vous pouvez comparer T à χ 2 en parcourant chaque colonne.n k n=9999 χ2 T χ2
Notez que la standardisation n'est pas possible pour car les moments appropriés n'existent même pas. Le manque de stabilité de la forme (lorsque vous numérisez de gauche à droite sur une ligne ou de haut en bas sur n'importe quelle colonne) est encore plus marqué pour n ≤ 4 .n<5 n≤4
la source
Je répondrai à la deuxième question. Le théorème central limite est pour toute séquence iid, au carré ou non au carré. Donc, dans votre cas, si est suffisamment grand, nous avonsk
où et V a r ( t 2 1 ) sont respectivement la moyenne et la variance de la distribution au carré de Student t avec n degrés de liberté. Notez que t 2 1 est distribué comme distribution F avec 1 et n degrés de liberté. Nous pouvons donc saisir les formules de moyenne et de variance de la page wikipedia . Le résultat final est alors:Et21 Var(t21) n t21 1 n
la source