J'utilise R et j'ai analysé mes données avec GLM avec lien binomial.
Je veux savoir quelle est la signification de l'interception dans le tableau de sortie. L'ordonnée à l'origine pour l'un de mes modèles est significativement différente, mais la variable ne l'est pas. Qu'est-ce que ça veut dire?
Quelle est l'interception. Je ne sais pas si je ne fais que m'embrouiller, mais après avoir cherché sur Internet, il n'y a rien à dire, c'est ça, faites attention ... ou pas.
S'il vous plaît, aidez, un étudiant très frustré
glm(formula = attacked_excluding_app ~ treatment, family = binomial,
data = data)
Deviance Residuals:
Min 1Q Median 3Q Max
-2.3548 0.3593 0.3593 0.3593 0.3593
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) 2.708 1.033 2.622 0.00874 **
treatmentshiny_non-shiny 0.000 1.461 0.000 1.00000
(Dispersion parameter for binomial family taken to be 1)
Null deviance: 14.963 on 31 degrees of freedom
Residual deviance: 14.963 on 30 degrees of freedom
(15 observations deleted due to missingness)
AIC: 18.963
Number of Fisher Scoring iterations: 5
r
generalized-linear-model
Samuel Waldron
la source
la source
Réponses:
Le terme d'interception est l'ordonnée à l'origine dans la partie linéaire de l'équation GLM, donc votre modèle pour la moyenne est , où g est votre fonction de liaison et X β est votre modèle linéaire. Ce modèle linéaire contient un "terme d'interception", c'est-à-dire:E[Y]=g−1(Xβ) g Xβ
Dans votre cas, l'ordonnée à l'origine est significativement non nulle, mais la variable ne l'est pas, donc cela signifie que
Parce que votre fonction de lien est binomiale, alors
Et donc avec juste le terme d'interception, votre modèle ajusté pour la moyenne est:
Vous pouvez voir que si cela correspond simplement à une chance de 50:50 d'obtenir Y = 1 ou 0, c'est-à-dire E [ Y ] = 1c=0 E[Y]=11+1=0.5
Donc, votre résultat indique que vous ne pouvez pas prédire le résultat, mais une classe (1 ou 0) est plus probable que l'autre.
la source
Il me semble qu'il peut y avoir un problème avec les données. Il est étrange que l'estimation du paramètre pour le coefficient soit de 0,000. Il semble que votre DV et votre IV soient dichotomiques et que les proportions de votre DV ne varient pas du tout avec votre IV. Est-ce correct?
L'interception, comme je l'ai noté dans mon commentaire (et comme la réponse de @corone l'indique) est la valeur du DV lorsque le IV est 0. Comment votre IV a-t-il été codé? Cependant, le fait que l'estimation du coefficient soit de 0,000 implique que le IV ne fait aucune différence.
la source
Dans votre cas, l'ordonnée à l'origine est la grande moyenne de
attacked_excluding_app
, calculée pour toutes les données indépendamment detreatment
. Le test de signification dans le tableau des coefficients vérifie s'il est significativement différent de zéro. Que cela soit pertinent dépend de si vous avez une raison a priori de vous attendre à ce qu'il soit nul ou non.Par exemple, imaginez que vous avez testé un médicament et un placebo pour déterminer leur effet sur la pression artérielle. Pour chaque sujet, vous enregistrez la variation de leur tension artérielle en calculant (pression après traitement - pression avant traitement) et la traitez comme variable dépendante dans votre analyse. Vous constatez ensuite que l'effet du traitement (médicament vs placebo) n'est pas significatif mais que l'interception est significativement> 0 - cela vous indiquerait qu'en moyenne, la tension artérielle de vos sujets a augmenté entre les deux temps de mesure. Cela pourrait être intéressant et nécessiter une enquête plus approfondie.
la source