Interprétation de la fonction récapitulative pour le modèle lm dans R

11

Quelle est la signification de t valueet Pr(>|t|)lors de l'utilisation de la summary()fonction sur le modèle de régression linéaire dans R?

Coefficients:
                              Estimate Std. Error t value Pr(>|t|)    
(Intercept)                    10.1595     1.3603   7.469 1.11e-13 ***
log(var)                        0.3422     0.1597   2.143   0.0322 *
itamarbe
la source
2
Voir ici, dernière phrase du premier paragraphe , et ici et ici .
Glen_b -Reinstate Monica
Et pour l'erreur standard, voir ici
Glen_b -Reinstate Monica

Réponses:

9

La valeur de la colonne t vous montre le test t associé au test de la signification du paramètre répertorié dans la première colonne. Par exemple, la valeur t de 7,369 fait référence au test t du (Intercept) 10,1595 divisé par l'erreur-type de cette estimation 1,3603. Pr (> | t |) vous donne la valeur de p pour ce test t (la proportion de la distribution t à ce df qui est supérieure à la valeur absolue de votre statistique t). 1.11e-13 est une notation scientifique. Les astérisques qui suivent le Pr (> | t |) permettent d'évaluer visuellement si la statistique répond aux différents critères .α

russellpierce
la source
4

Je ne fais pas tout à fait grok t-test, mais wikipedia a un bon article sur la valeur p - fondamentalement, la valeur p est la chance que le résultat que vous voyez s'est produit en raison d'une variation aléatoire. Généralement, une valeur de p de 0,05 ou moins (interprétée grosso modo comme «il y a 5% de chances ou moins que cela se produise juste en raison d'une variation aléatoire») signifie que le résultat est significatif.

Aerik
la source
4
Parce que ces questions ont été largement discutées sur ce site, je serai bref: (1) la valeur de p est une probabilité conditionnelle à l'hypothèse nulle (ce n'est pas une "chance" inconditionnelle et elle est probablement contrefactuelle ) et (2) elle n'est pas une chance de "résultat que vous voyez" - qui dans ce cas est pratiquement nul - mais plutôt la chance - sous l'hypothèse nulle - que votre résultat se situe dans une "région critique" pour le test d'hypothèse. Bien que cela puisse ressembler à une pioche, une grande confusion peut résulter d'une mauvaise interprétation d'un langage vague.
whuber
2
@whuber - merci d'avoir pris le temps de rédiger une description correcte et précise de la valeur p. Honnêtement, je le sais à peine moi-même, mais je donnais volontairement une réponse "lâche" pour aider le demandeur à se faire une idée de base sans le submerger ... il me semble que beaucoup de statistiques sont comme ça - ce qu'une statistique dit réellement n'est pas si facile à utiliser, donc les gens donnent des approximations très approximatives qui sont plus faciles à digérer. Je pense que c'est dans "Six Easy Pieces" que Feynman a expliqué la physique comme ça. "Ce n'est pas exact, mais c'est une approximation utile"
Aerik
1
Malheureusement, un langage vague conduit à de nombreuses actions erronées prises à la suite d'un malentendu.
Glen_b -Reinstate Monica