Autant que je sache, le test de Wald dans le contexte de la régression logistique est utilisé pour déterminer si une certaine variable prédictive est significative ou non. Il rejette l'hypothèse nulle du coefficient correspondant égal à zéro.
Le test consiste à diviser la valeur du coefficient par l'erreur type .
Ce qui me rend confus, c'est que est également appelé score Z et indique la probabilité qu'une observation donnée vienne de la distribution normale (avec une moyenne nulle).
logistic
z-statistic
utilisateur695652
la source
la source
Réponses:
Les estimations des coefficients et les intersections dans la régression logistique (et tout GLM) sont obtenues via l' estimation du maximum de vraisemblance (MLE). Ces estimations sont indiquées avec un chapeau sur les paramètres, quelque chose comme θ . Notre paramètre d'intérêt est notée θ 0 et cela est généralement 0 que nous voulons vérifier si le coefficient est différent de 0 ou non. De la théorie asymptotique de MLE, nous savons que la différence entre θ et θ 0 sera approximativement normale de moyenne 0 (détails peuvent être trouvés dans les statistiques mathématiques livre comme Larry Wasserman Toutes les statistiques ). Rappelons que les erreurs types ne sont rien d’autre queθ^ θ0 θ^ θ0 Écarts types des statistiques (Sokal et Rohlf écrivent dans leur livre Biometry : "une statistique est l’une des nombreuses quantités statistiques calculées ou estimées", par exemple la moyenne, la médiane, l’écart type, le coefficient de corrélation, le coefficient de régression, ...). Diviser une distribution normale avec une moyenne 0 et un écart type par son écart type produira la distribution normale standard avec une moyenne 0 et un écart type 1. La statistique de Wald est définie comme (par exemple, Wasserman (2006): Statistics , pages 153, 214). -215):
W = ( β - β 0 )σ
ou
W2=(β-β0)2
R
, regardez ces deux exemples:Régression logistique
Régression linéaire normale (MCO)
Un autre article lié peut être trouvé ici .
la source