Problème de comparaison de modèles GLM ayant une fonction de liaison différente

Étant donné le même ensemble de covariables et de familles de distribution, comment comparer des modèles ayant différentes fonctions de liaison?

Je pense que la bonne réponse ici est "AIC / BIC", mais je ne suis pas sûr à 100%.

Est-il possible d'avoir des modèles imbriqués s'ils ont un lien différent?

generalized-linear-model aic link-function Davide
la source

Notez que "AIC / BIC" est l' une des réponses possibles mais, en principe, toute technique de sélection de modèle (appropriée) pourrait être employée.

Non, ils ne sont pas imbriqués. Rappelez-vous également que lorsque vous utilisez AIC / BIC, les constantes de normalisation sont également importantes .

Les critères d'information, comme l'AIC et le BIC, ajustent simplement la déviance du modèle pour sa complexité (c'est-à-dire le nombre de paramètres). Si vous avez le même nombre de covariables (pas même nécessairement les mêmes covariables elles-mêmes), cet ajustement ne sera pas pertinent. Vous pouvez les vérifier en comparant directement les déviances. Vous pouvez trouver utile de lire ma réponse ici: modèles de différence entre logit et probit , qui touche à ce problème.

gung - Rétablir Monica

Une autre possibilité pour comparer des modèles, qui est très générale, mais exige davantage de votre part, consiste à utiliser la méthode de paramétrage croisé d'amorçage. Vous pouvez trouver un pdf ici .

gung - Rétablir Monica

Y a-t-il une famille en particulier que vous avez en tête avec 2 fonctions de liaison possibles? c.-à-d. famille binomiale, lien logit vs journal?

Placidia

Réponses:

Pour ce problème, vous pouvez également utiliser ce que l'on appelle des «tests de qualité des liens», dont le traitement canonique a été publié par Daryl Pregibon dans Applied Statistics en 1980. Vous voudrez peut-être lire l' article ici.

Il y a également eu des travaux plus récents sur ce front, notamment par Cheng et Wu dans leur article JASA de 1994 .

Comme indiqué par @gung, l'utilisation de la déviance est également possible, voir par exemple ce document si vous ne voulez pas le prendre à sa valeur nominale.

Momo
la source

+1, c'est bien d'avoir le papier canonique. BTW, je suppose que vous vouliez dire du travail récent , pas du travail de "raison".

gung - Rétablir Monica

(Je copie juste les informations des commentaires ici afin que cette question ne s'affiche pas comme officiellement sans réponse.)

Vous pouvez comparer les deux modèles en comparant les écarts. Tout ce que l'AIC et le BIC font est d'ajuster les écarts pour le nombre de paramètres dans le modèle. Puisque ce nombre est le même, cela ne fera aucune différence. En général, il sera très difficile de différencier les différentes fonctions de liaison à moins qu'elles ne diffèrent par leur forme; il est souvent préférable d'utiliser des connaissances théoriques pour déterminer la fonction de lien appropriée. Par exemple, les liens logit et probit diffèrent à peine dans leur forme, mais diffèrent dans la façon dont vous envisagez le processus de génération de données (comme je l'explique ici ).

gung - Réintégrer Monica
la source