J'ai le modèle linéaire généralisé suivant. L'objet glmDV
est modélisé comme une proportion de succès sur le total des essais. Les objets x_i
sont des variables continues.
À quoi cela ressemble-t-il en notation mathématique?
winp.glm = glm(glmDV ~ x1 + x2 + x3 + x4 + x5 + x6 + x7,
data=myData, family=binomial("logit"))
r
generalized-linear-model
logit
notation
user2205916
la source
la source
0
s &1
s (que je suppose être ce que vous avez basé sur votre description), vous devez utiliser unweights
argument w / ? Glm , où les poids sont le nombre total d'essais pour chaque observation.Réponses:
Pour une régression logistique binaire, le cas d'utilisation habituel pour le GLM binomial avec un lien logit, vous modélisez la probabilité que votre variable dépendante soit un «succès» (ou «oui»), classiquement codé comme . Pour ce faire, modélisez les cotes du journal. Donc, plutôt que de modéliser la moyenne de la réponse comme dans OLS, vous modélisez le changement dans les cotes du journal:1
Où et .logit(x)=log(x1−x) logit−1(x)=exp(x)1+exp(x)
Une explication plus approfondie et très accessible de cela peut être trouvée dans Agresti, An Introduction to Categorical Data Analysis.
Mais à votre question particulière, vous déclarez que vous modélisez la proportion de succès. Ce n'est pas vraiment ce à quoi sert un GLM binomial. Cependant, ce que vous cherchez vraiment, c'est ce que fait un GLM binomial, et c'est toujours possible dans R. Cela nécessite juste un léger ajustement à ce que vous faites. Dans le cas où vous avez un nombre fini d'essais qui peut avoir succès, vous pouvez toujours utiliser le même modèle, qui a la densité Parce que vos valeurs sont fixées par la conception expérimentale, et est vos succès observés, vous effectuez une inférence sur le paramètren y∈{0...n}
En termes de R, créez simplement un objet (que vous appelezy n−y
glmDV
) qui est une matrice à 2 colonnes, la première colonne le nombre de succès et la seconde le nombre total d'échecs . Le reste de la déclaration reste le même!la source
glm
et, à ma connaissance, il n'accepte qu'une variable de réponse à 1 colonne, pas deux colonnes. Veuillez me corriger si je me trompe et citer la documentation pertinente si possible. Je vous remercie!glm
documentation. Un bon moyen de découvrir le fonctionnement des fonctions R est de rechercher le nom de la fonction sur Google; cela révèle généralement la documentation pertinente. Vous pouvez également taper?glm
dans une console R