Que faites-vous si vos degrés de liberté dépassent la fin de vos tables?

11

Les degrés de liberté dans ma table F ne montent pas assez haut pour mon gros échantillon.

Par exemple, si j'ai un F avec 5 et 6744 degrés de liberté, comment puis-je trouver la valeur critique de 5% pour une ANOVA?

Et si je faisais un test du chi carré avec de grands degrés de liberté?

[Une question comme celle-ci a été publiée il y a un certain temps, mais l'OP a fait une erreur et avait en fait un df plus petit, le réduisant à un doublon - mais la grande question df d'origine devrait avoir une réponse quelque part sur le site]

Glen_b -Reinstate Monica
la source
1
Obtenez une plus grande table?
Federico Poloni

Réponses:

16

Tableaux F :

  1. Le moyen le plus simple de tous - si vous le pouvez - est d'utiliser un package de statistiques ou un autre programme pour vous donner la valeur critique. Ainsi, par exemple, dans R, nous pouvons le faire:

     qf(.95,5,6744)
    [1] 2.215425
    

    (mais vous pouvez aussi facilement calculer une valeur de p exacte pour votre F).

  2. Habituellement, les tables F sont livrées avec un degré de liberté "infini" à la fin de la table, mais quelques-unes ne le font pas. Si vous avez un très grand df (par exemple, 6744 est vraiment grand), vous pouvez utiliser l' entrée infini ( ) à sa place.

    Vous pourriez donc avoir des tables pour qui donnent 120 df et df:ν1=5

          ...    5      ...
     ⁞
    120        2.2899   
     ∞         2.2141
    

    La ligne df y fonctionnera pour tout très grand ν 2 (dénominateur df). Si nous utilisons cela, nous avons 2.2141 au lieu du 2.2154 exact, mais ce n'est pas trop mal.ν2

  3. Si vous ne disposez pas d'une infinité de degrés de liberté, vous pouvez en calculer une à partir d'un tableau khi-deux, en utilisant la valeur critique du numérateur df divisée par ces df

    Ainsi , par exemple, pour un valeur critique, prendre un χ 2 5 valeur critique et diviser par 5 . La valeur critique de 5% pour un χ 2 5 est 11,0705 . Si nous divisons par 5, c'est 2,2141 qui est la ligne du tableau ci-dessus.F5,χ525χ5211.070552.2141

  4. Si vos degrés de liberté peuvent être un peu trop petits pour utiliser l'entrée "infini" (mais toujours beaucoup plus grands que 120 ou quoi que votre table monte), vous pouvez utiliser l' interpolation inverse entre le df fini le plus élevé et l'entrée infini. Disons que nous voulons calculer une valeur critique pour dfF5,674

       F       df     120/df    
     ------   ----    -------
     2.2899    120      1     
       C       674    0.17804
     2.2141     ∞       0    
    

    Ensuite, nous calculons la valeur critique inconnue, commeC

    C2.2141+(2.28992.2141)×(0.178040)/(10)2.2276

    (La valeur exacte est , donc cela fonctionne plutôt bien.)2.2274

    Plus de détails sur l'interpolation et l'interpolation inverse sont donnés à ce poste lié.


Tables chi carré :

Si votre df chi carré est vraiment grand, vous pouvez utiliser des tableaux normaux pour obtenir une approximation.

Pour les grands df la distribution du khi carré est approximativement normale avec la moyenne ν et la variance 2 ν . Pour obtenir la valeur supérieure de 5%, prenez la valeur critique unilatérale de 5% pour une normale standard ( 1,645 ) et multipliez par νν2ν1.645 et ajoutezν.2νν

Par exemple, imaginez que nous avions besoin d'une valeur critique supérieure de 5% pour un .χ67442

Nous calculerions . La réponse exacte (à5chiffres significatifs) est6936.2.1.645×2×6744+6744693556936.2

Si les degrés de liberté sont plus petits, on peut utiliser le fait que si est χ 2 ν alors Xχν2.2X˙N(2ν1,1)

Ainsi, par exemple, si nous avions df, nous pourrions utiliser cette approximation. La valeur critique supérieure exacte de 5% pour un chi carré avec 674 df est (à 5 chiffres) 735,51 . Avec cette approximation, nous calculerions comme suit:674735.51

Prendre la valeur critique supérieure (une queue) de 5% pour une normale standard (1,645), ajouter , mettez le total au carré et divisez par 2. Dans ce cas:2ν1

.(1.645+2×6741)2/2735.2

Comme nous le voyons, c'est assez proche.

(Xν)13˙N(129ν,29ν)

Glen_b -Reinstate Monica
la source
2
χ2Fχ2Rdf2/df1 * (-1 + 1/(1-qchisq(0.95, df1) / df2))2.2177χ2
... ou l'intention est-elle que les erreurs des deux approches soient de sens opposé (suggérant peut-être de combiner les deux?).
Glen_b -Reinstate Monica
Je me souviens que je faisais référence au point 4.
whuber
Ah, cela pourrait avoir plus de sens. Désolé d'être dense. Je vais réessayer.
Glen_b -Reinstate Monica