Pourquoi la régression bêta / dirichlet n'est pas considérée comme un modèle linéaire généralisé?

26

La prémisse est cette citation de la vignette du package R betareg1 .

De plus, le modèle partage certaines propriétés (telles que le prédicteur linéaire, la fonction de lien, le paramètre de dispersion) avec les modèles linéaires généralisés (GLM; McCullagh et Nelder 1989), mais ce n'est pas un cas particulier de ce cadre (pas même pour une dispersion fixe )

Cette réponse fait également allusion au fait:

[...] Il s'agit d'un type de modèle de régression qui convient lorsque la variable de réponse est distribuée en Bêta. Vous pouvez le considérer comme analogue à un modèle linéaire généralisé. C'est exactement ce que vous recherchez [...] (c'est moi qui souligne)

Le titre de la question dit tout: pourquoi la régression bêta / dirichlet n'est pas considérée comme des modèles linéaires généralisés (n'est-ce pas)?


Pour autant que je sache, le modèle linéaire généralisé définit des modèles basés sur l'attente de leurs variables dépendantes conditionnelles aux variables indépendantes.

f est la fonction de lien qui mappe l'attente,g est la distribution de probabilité,Y les résultats etX les prédicteurs,sont des paramètres linéaires etla variance.σ 2βσ2

f(E(YX))g(βX,Iσ2)

Différents GLM imposent (ou relâchent) la relation entre la moyenne et la variance, mais g doit être une distribution de probabilité dans la famille exponentielle, une propriété souhaitable qui devrait améliorer la robustesse de l'estimation si je me souviens bien. Les distributions Beta et Dirichlet font partie de la famille exponentielle, donc je suis à court d'idées.


[1] Cribari-Neto, F. et Zeileis, A. (2009). Régression bêta dans R.

Pyromane
la source
2
(+1) Connexes: stats.stackexchange.com/a/189196 .
Amoeba dit Reinstate Monica
@amoeba Merci pour le lien, je n'avais jamais vu cette question auparavant.
Firebug
2
Je pense que le problème est que si vous écrivez la distribution bêta avec les paramètres standard , b (c'est-à - dire que a = b = 1 implique uniforme (0,1)), alors la distribution bêta est dans la famille exponentielle, si vous l'écrivez en termes de μ (moyenne) et ϕ (dispersion), ce n'est pas le cas. Mais je ne me suis jamais autant soucié de savoir si une distribution est dans la famille exponentielle. unebune=b=1μϕ
Cliff AB du
@CliffAB Après avoir lu les commentaires sous la réponse de Tim ci-dessous, il semble que le paramétrage de la bêta mène à la non-orthogonalité des paramètres, ce qui semble être une exigence pour les GLM McCullagh-Nelder.
Firebug
1
Je pense que cette courte réponse: stats.stackexchange.com/a/18812/28666 est pertinente et ajoute aux réponses ici (faisant allusion à la raison pour laquelle les GLM ont été définis à l'origine avec une famille de dispersion exponentielle).
amibe dit Réintégrer Monica

Réponses:

20

Vérifiez la référence d'origine:

Ferrari, S., et Cribari-Neto, F. (2004). Régression bêta pour la modélisation des taux et des proportions. Journal of Applied Statistics, 31 (7), 799-815.

comme le notent les auteurs, les paramètres de la distribution bêta re-paramétrisée sont corrélés, donc

Il est à noter que les paramètres et ϕ ne sont pas orthogonaux, contrairement à ce qui est vérifié dans la classe des modèles de régression linéaire généralisée (McCullagh et Nelder, 1989).βϕ

Ainsi, bien que le modèle ressemble à un GLM et quacks comme un GLM, il ne correspond pas parfaitement au cadre.

Tim
la source
7
+1 mais ce serait bien d'avoir une réponse plus détaillée. Personnellement, je ne comprends pas la citation (même après avoir ouvert le document lié). Pourquoi ces paramètres ne sont-ils pas orthogonaux dans la régression bêta? .. Pourquoi est-ce requis pour les GLM? .. Etc.
Amoeba dit Reinstate Monica
3
@amoeba honnêtement, je ne suis pas le genre de personne qui peut vous donner une réponse détaillée à ce sujet. Je n'ai jamais été autant intéressé par la théorie derrière les GLM pour avoir une compréhension suffisamment profonde de ces subtilités. McCullagh et Nelder mentionnent cette exigence, mais il faudrait que je vérifie leur livre pour voir exactement pourquoi c'est important. Si quelqu'un donne une explication détaillée de la raison pour laquelle il s'agit d'un problème, j'envisagerais d'émettre une prime pour une telle réponse.
Tim
9
L'exigence d'orthogonalité dans les GLM est importante: cela signifie que vous pouvez estimer l'équation sans vous soucier de mal spécifier le reste de la probabilité. Les estimations des paramètres sont cohérentes si l'équation moyenne ci-dessus est correctement spécifiée. L'inférence est valable si en outre la variance est correctement spécifiée. Cependant, en régression bêta, vous ne pouvez pas séparer les deux équations du modèle de cette manière, même si ϕ n'est qu'une constante. Pour des résultats cohérents, tout doit être spécifié correctement. g(μ)=xβϕ
Achim Zeileis
3
@AchimZeileis Je me suis souvenu avoir vu ton nom sur CV. Ce que vous dites est parfaitement logique. Peut-être aimeriez-vous transformer votre commentaire pour y répondre en ajoutant un peu plus de justification? Comme je l'ai dit, je serais heureux d'accorder une prime à quelqu'un qui donne une réponse suffisamment détaillée pour la question.
Tim
2
@Tim va essayer de le faire quand j'aurai plus de temps. C'est pourquoi j'ai pensé qu'un petit commentaire
valait
8

La réponse de @probabilityislogic est sur la bonne voie.

La distribution bêta est dans la famille exponentielle à deux paramètres . Les modèles GLM simples décrits par Nelder et Wedderburn (1972) n'incluent pas toutes les distributions dans la famille exponentielle à deux paramètres.

En ce qui concerne l'article de N&W, le GLM s'applique aux fonctions de densité du type suivant (ce fut plus tard nommé famille de dispersion exponentielle dans Jørgensen 1987 ):

π(z;θ,ϕ)=exp[α(ϕ){zθg(θ)+h(z)}+β(ϕ,z)]

avec une fonction de liaison supplémentaire et un modèle linéaire pour le paramètre naturel θ = f ( μ ) = f ( X β ) .f()θ=F(μ)=F(Xβ)


Nous pourrions donc réécrire également la distribution ci-dessus:

π(z;μ,ϕ)=exp[z(f(μ)α(ϕ))+h(z)α(ϕ)-g(F(μ))α(ϕ)+β(ϕ,z)]

La famille exponentielle à deux paramètres est:

F(z;θ1,θ2)=eXp[T1(z)η1(θ1,θ2)+T2(z)η2(θ1,θ2)-g(θ1,θ2)+h(z)]

qui semble similaire mais plus général (même si l'un des est constant).θ


La différence est claire, et il n'est pas possible de mettre la distribution bêta sous forme de GLM.

Cependant, je manque de compréhension suffisante pour créer une réponse plus intuitive et bien informée (j'ai le sentiment qu'il peut y avoir des relations beaucoup plus profondes et plus élégantes avec une variété de principes fondamentaux). Le GLM généralise la distribution de l'erreur en utilisant un modèle de dispersion exponentielle à variable unique à la place d'un modèle des moindres carrés et généralise la relation linéaire dans la moyenne, en utilisant une fonction de lien.

L'intuition la meilleure et la plus simple semble être la dispersion - terme dans l'exponentielle, qui se multiplie avec tout et donc la dispersion ne varie pas avec θ . Alors que plusieurs familles exponentielles à deux paramètres et des méthodes de quasi-vraisemblance, le paramètre de dispersion est également fonction de θ .α(ϕ)θθ

Sextus Empiricus
la source
Le deuxième paramètre dans le df défini par N&W est la dispersion. Il étend la famille exponentielle naturelle à un paramètre π ( z ; θ )ϕπ(z;θ)
Sextus Empiricus
@amoeba beta est une distribution de famille exponentielle bivariée, par exemple www2.stat.duke.edu/courses/Spring11/sta114/lec/expofam.pdf
Tim
2
Je ne sais pas si ce n'est pas tout à fait possible, même avec une dispersion fixe. Du moins pas selon le GLM comme indiqué par N&W (ce que je sais, c'est que beaucoup de gens font des choses beaucoup plus difficiles pour résoudre la régression bêta). Je modifierai la réponse pour montrer ce qui se passe et où cela se passe mal, si nous essayons de suivre le même chemin des moindres carrés itératifs repondérés.
Sextus Empiricus
2
J'ai quelque peu modifié la réponse. 1) Ma description initiale des familles et des modèles de dispersion était incorrecte. Le GLM inclut toutes les distributions des familles exponentielles à un paramètre car ce n'est pas seulement cette fonction de densité, mais aussi une fonction de lien. 2) En termes de meilleure vue intuitive, je n'ai pas pu aller loin et je ne m'attends pas à aller loin bientôt. Les modèles GLM se rapportent au modèle classique dans diverses représentations, ajoutant des poids à la formulation matricielle des procédures d'ajustement, dérivées des fonctions log-vraisemblance, y compris les termes avec la fonction de lien et la variance, .....
Sextus Empiricus
2
J'ai pris la liberté de modifier un peu votre réponse, j'espère que vous êtes d'accord avec les modifications. En outre, cela ressemble à cette réponse. Stats.stackexchange.com/a/18812/28666 indique pourquoi N&W a utilisé cette famille de distribution particulière et non plus large.
amibe dit Réintégrer Monica
2

Je ne pense pas que la distribution bêta fasse partie de la famille de dispersion exponentielle . Pour l'obtenir, vous devez avoir une densité

f(y;θ,τ)=exp(yθc(θ)τ+d(y,τ))

pour les fonctions spécifiées et d ( ) . La moyenne est donnée par c ( θ ) et la variance est donnée par τ c ( θ ) . Le paramètre θ est appelé paramètre canonique.c()()c(θ)τc(θ)θ

La distribution bêta ne peut pas être écrit de cette façon - une façon de voir c'est en faisant remarquer qu'il n'y a pas terme la probabilité log - il a log [ y ] et log [ 1 - y ] au lieuybûche[y]bûche[1-y]

fbeta(y;μ,ϕ)=exp(ϕμlog[y1y]+ϕlog[1y]log[B(ϕμ,ϕ(1μ)]log[y1y])

Une autre façon de voir que la version bêta n'est pas une famille de dispersion exponentielle est qu'elle peut s'écrire xetzsont indépendants et suivent tous deux des distributions gamma avec le même paramètre d'échelle (et gamma est une famille exponentielle).y=xx+zxz

probabilitéislogique
la source
1
Cette réponse n'est pas correcte telle qu'elle est écrite. Une façon de voir cela est que, selon la logique présentée, les distributions de Bernoulli et binomiales, par exemple, ne seraient pas non plus dans la classe des familles exponentielles.
Cardinal
2
Désolé, vous avez raison de dire que l'exemple que j'ai donné était erroné. (Attention: l'arithmétique mentale et l'utilisation mobile de CrossValidated peuvent être dangereuses!) Cependant, mon argument est toujours valable. Cette réponse est incorrecte car elle opte pour un concept très étroitement "défini" de "famille exponentielle" - beaucoup plus étroit que toute source conventionnelle ou utilisation pratique.
Cardinal
2
Hmm. Wikipedia répertorie la version bêta dans la liste des distributions de familles exponentielles.
Amoeba dit Reinstate Monica
1
Vrai - je pensais à la famille exponentielle naturelle - qui est un cas particulier
probabilités
1
θ