Famille binomiale R avec lien d'identité

8

Je veux adapter un modèle linéaire de R avec family=binomial(link="identity"), cependant, la famille binomiale n'a pas de lien d'identité. Que devrais-je faire?

David
la source
Je pense qu'il y a un problème statistique sous-jacent ici.
Glen_b -Reinstate Monica
oui, la question suivante posera des questions sur Ajuster l'erreur standard pour la surdispersion.
david
Mais pour le premier, j'ai besoin d'utiliser le lien d'identité dans la famille binomiale, mais R ne le permet pas.
david
1
Notez que si vous devez à la fois gérer la surdispersion et utiliser un lien d'identité, vous devriez envisager d'aller directement vers un quasi-modèle avec fonction de variance binomiale. Un modèle binomial à interception seule peut être monté à la main .
Glen_b -Reinstate Monica
2
(Et si vous voulez que le paramètre de dispersion fixé à un: family=binomial(link=make.link("identity")).
Scortchi - Réintégrer Monica

Réponses:

9

Voir Wikipédia sur le modèle de probabilité linéaire , et les messages CV ici et ici pour le contexte statistique. Bien que ce ne soit pas "faux", vous voudriez une bonne raison d'utiliser un lien d'identité pour modéliser une probabilité de Bernoulli.

Selon le familymanuel

la famille binomiale [accepte] les liens logit, probit, cauchit, (correspondant à la logistique, respectivement normale et CDFs Cauchy) log et cloglog(log-log complémentaire)

Mais

Les arguments de lien et de variance ont une sémantique plutôt maladroite pour la rétrocompatibilité. La manière recommandée est de les fournir sous forme de chaînes de caractères entre guillemets, mais elles peuvent également être fournies sans guillemets (sous forme de noms ou d'expressions). De plus, ils peuvent également être fournis sous la forme d'un vecteur de caractères de longueur un donnant le nom de l'une des options, ou sous forme de liste (pour link, de classe "link-glm"). Les restrictions s'appliquent uniquement aux liens donnés en tant que noms: lorsqu'ils sont donnés en tant que chaîne de caractères, tous les liens connus make.linksont acceptés.

Fonctionne family=binomial(link="identity")mais family=binomial(link=identity)ne fonctionne pas. (Si vous trouvez différemment, cela pourrait être lié à la version R.) Pour permettre une dispersion excessive, utilisez family=quasi(link="identity", variance = "mu(1-mu)").

Scortchi - Réintégrer Monica
la source
le lien = "identité" vs lien = identité a été d'une grande aide. Ceci est une séance d'entraînement dans le manuel CDA d'Agresti. Le code qu'il fournit est le quasi (lien ...) dont vous discutez, cependant la simplicité d'ajouter "" est une solution élégante. À ma connaissance, l'appel link = "identity" représente le binôme comme un modèle linéaire.
Justin Peterson du