Test de Wald en régression (OLS et GLM): distribution t- vs z

22

Je comprends que le test de Wald pour les coefficients de régression est basée sur la propriété suivante qui détient asymptotiquement (par exemple Wasserman (2006): Toutes les statistiques , pages 153, 214-215): βdésigne le coefficient de régression estimé,^soi(β)représente l'erreur type du coefficient de régression etβ0est la valeur d'intérêt (β0est généralement0 pour tester si le coefficient est significativement différent de 0). Letest detailleαWald est donc: rejeterH0lorsque| W| >zα/

(β^β0)se^(β^)N(0,1)
β^se^(β^)β0β0αH0W= β|W|>zα/2
W=β^se^(β^).

Mais lorsque vous effectuez une régression linéaire avec lmdans R, une valeur au lieu d'une valeur z est utilisée pour tester si les coefficients de régression diffèrent significativement de 0 (avec ). De plus, la sortie de in R donne parfois des valeurs z et parfois t comme statistiques de test. Apparemment, les valeurs z sont utilisées lorsque le paramètre de dispersion est supposé être connu et les valeurs t sont utilisées lorsque le paramètre de dispersion est estimé (voir ce lien ).tzsummary.lmglmztzt

Quelqu'un pourrait-il expliquer pourquoi une distribution est parfois utilisée pour un test de Wald même si le rapport du coefficient et de son erreur standard est supposé être distribué comme normal normal?t

Modifier après la réponse à la question

Ce message fournit également des informations utiles à la question.

COOLSerdash
la source
2
Qu'est-ce qui vous fait penser que la statistique de test rapportée est nécessairement un test de Wald?
Glen_b -Reinstate Monica
3
Parce que les valeurs ou t sont toujours le coefficient divisé par son erreur standard dans et . ztlmglm
COOLSerdash

Réponses:

20

glmzλglmt

tz

t

wcampbell
la source
3

Dans le cadre GLM, en général, la statistique de test W que vous avez mentionnée est asymptotiquement distribuée Normalement , c'est pourquoi vous voyez dans R les valeurs z .

En plus de cela, lorsqu'il s'agit d'un modèle linéaire, c'est-à-dire d'un GLM avec une variable de réponse distribuée normale, la distribution de la statistique de test est un t de Student , donc dans R vous avez des valeurs de t .

EdoLu
la source