Prenons un cas où votre variable de réponse est un ensemble de «succès» et «échecs» (également représentés par «oui» et «non», s et s, etc.). Si cela était vrai, il ne peut pas être le cas que votre terme d' erreur soit normalement distribué . Au lieu de cela, votre terme d'erreur serait par définition Bernoulli . Ainsi, l'une des hypothèses auxquelles il est fait allusion est violée. Une autre hypothèse de ce type est celle de l'homoscédasticité, mais elle serait également violée, car la variance est fonction de la moyenne. Nous pouvons donc voir que le GLM (OLS) est inapproprié dans ce cas. 10
Notez que, pour un modèle de régression linéaire typique, ce que vous (c'est-à-dire, ) est , la moyenne de la distribution normale conditionnelle de la réponse à l'endroit exact où . Ce dont nous avons besoin dans ce cas, c'est de prédire , la probabilité de «succès» à cet endroit. Nous considérons donc notre distribution de réponse comme Bernoulli, et nous prédisons le paramètre qui contrôle le comportement de cette distribution. Il y a cependant une complication importante ici. Plus précisément, il y aura des valeurs pour qui, en combinaison avec vos estimations produiront des valeurs prédites de (c'est-à-dire,y^iμiX=xiπ^iXβy^iπ^i) qui sera ou . Mais cela est impossible, car la plage de est . Nous devons donc transformer le paramètre afin qu'il puisse s'étendre , tout comme le côté droit de votre GLiM. Par conséquent, vous avez besoin d'une fonction de lien . <0>1π(0, 1)π(−∞, ∞)
À ce stade, nous avons stipulé une distribution de réponse (Bernoulli) et une fonction de lien (peut-être la transformation logit ). Nous avons déjà une partie structurelle de notre modèle: . Nous avons donc maintenant toutes les pièces nécessaires de notre modèle. Il s'agit maintenant du modèle linéaire généralisé, car nous avons «assoupli» les hypothèses concernant notre variable de réponse et les erreurs. Xβ
Pour répondre plus directement à vos questions spécifiques, le modèle linéaire généralisé assouplit les hypothèses sur et en proposant une distribution de réponse (dans la famille exponentielle ) et une fonction de lien qui mappe le paramètre en question à l'intervalle . YU(−∞, ∞)
Pour en savoir plus sur ce sujet, il peut vous être utile de lire ma réponse à cette question: Différence entre les modèles logit et probit .