Je dois avouer que je n'avais jamais entendu parler de ce terme dans aucune de mes classes, de premier cycle ou de cycle supérieur.
Que signifie qu'une régression logistique soit bayésienne? Je cherche une explication avec une transition de la logistique régulière à la logistique bayésienne similaire à la suivante:
Voici l'équation du modèle de régression linéaire: .
C'est l'équation du modèle de régression logistique: . Cela se fait lorsque y est catégorique.
Ce que nous avons fait, c'est changer en .ln ( E ( y )
Alors, que fait le modèle de régression logistique dans la régression logistique bayésienne? Je suppose que ce n'est pas quelque chose à voir avec l'équation.
Cet aperçu du livre semble définir, mais je ne comprends pas vraiment. Qu'est-ce que tout cela avant, vraisemblablement? Qu'est-ce que ? Quelqu'un peut-il expliquer cette partie du livre ou du modèle logit bayésien d'une autre manière?
Remarque: Cela a déjà été demandé mais n'a pas été très bien répondu je pense.
Réponses:
La régression logistique peut être décrite comme une combinaison linéaire
qui est passé par la fonction de lien :g
où la fonction de liaison est une fonction logit
où ne prend que des valeurs dans et les fonctions logit inverses transforment la combinaison linéaire dans cette plage. C'est là que s'arrête la régression logistique classique.{ 0 , 1 } ηOui { 0 , 1 } η
Cependant, si vous vous souvenez que pour les variables qui ne prennent que des valeurs dans , alors peut être considéré comme . Dans ce cas, la sortie de la fonction logit pourrait être considérée comme une probabilité conditionnelle de "succès", c'est-à-dire . La distribution de Bernoulli est une distribution qui décrit la probabilité d'observer le résultat binaire, avec un paramètre , nous pouvons donc décrire comme{ 0 , 1 } E ( Y | X , β ) P ( Y = 1 | X , β ) P ( Y = 1 | X , β ) p YE( Y) = P( Y= 1 ) { 0 , 1 } E( Y| X, β) P( Y= 1 | X, β) P( Y= 1 | X, β) p Oui
Donc, avec la régression logistique, nous recherchons certains paramètres qui se combinent avec des variables indépendantes forment une combinaison linéaire . Dans la régression classique (nous supposons que la fonction de lien est une fonction d'identité), cependant pour modéliser qui prend des valeurs dans nous devons transformer pour l'adapter dans la plage .X η E ( Y | X , β ) = η Y { 0 , 1 } η [ 0 , 1 ]β X η E( Y| X, β) = η Oui { 0 , 1 } η [ 0 , 1 ]
Maintenant, pour estimer la régression logistique de manière bayésienne, vous prenez quelques priors pour les paramètres comme avec la régression linéaire (voir Kruschke et al, 2012 ), puis utilisez la fonction logit pour transformer la combinaison linéaire , afin d'utiliser sa sortie comme un paramètre de la distribution de Bernoulli qui décrit votre variableDonc, oui, vous utilisez en fait l'équation et la fonction de lien logit de la même manière que dans le cas fréquentitionniste, et le reste fonctionne (par exemple en choisissant des a priori) comme avec l'estimation de la régression linéaire de la manière bayésienne. η p Yβje η p Oui
L'approche simple pour choisir les a priori est de choisir des distributions normales (mais vous pouvez également utiliser d'autres distributions, par exemple la distribution - ou Laplace pour un modèle plus robuste) pour les avec des paramètres et qui sont prédéfinis ou pris des prieurs hiérarchiques . Maintenant, ayant la définition du modèle, vous pouvez utiliser un logiciel tel que JAGS pour effectuer une simulation Markov Chain Monte Carlo pour vous permettre d'estimer le modèle. Ci-dessous, je poste le code JAGS pour un modèle logistique simple ( cliquez ici pour plus d'exemples).β i μ i σ 2 it βje μje σ2je
Comme vous pouvez le voir, le code se traduit directement en définition de modèle. Ce que fait le logiciel, c'est qu'il tire certaines valeurs des valeurs normales pour
a
puisb
, il utilise ces valeurs pour estimerp
et enfin, utilise la fonction de vraisemblance pour évaluer la probabilité de vos données compte tenu de ces paramètres (c'est lorsque vous utilisez le théorème de Bayes, voir ici pour description plus détaillée).Le modèle de régression logistique de base peut être étendu pour modéliser la dépendance entre les prédicteurs à l'aide d'un modèle hiérarchique (y compris les hyperpriors ). Dans ce cas, vous pouvez tirer les de la distribution normale multivariée qui nous permet d'inclure des informations sur la covariance entre des variables indépendantesβje Σ
... mais cela entre dans les détails, alors arrêtons-nous ici.
La partie "bayésienne" ici consiste à choisir des a priori, en utilisant le théorème de Bayes et en définissant le modèle en termes probabilistes. Voir ici pour la définition du "modèle bayésien" et ici pour une intuition générale sur l'approche bayésienne . Ce que vous pouvez également remarquer, c'est que la définition des modèles est assez simple et flexible avec cette approche.
Kruschke, JK, Aguinis, H., et Joo, H. (2012). Le moment est venu: méthodes bayésiennes pour l'analyse des données en sciences organisationnelles. Méthodes de recherche organisationnelle, 15 (4), 722-752.
Gelman, A., Jakulin, A., Pittau, GM et Su, Y.-S. (2008). Une distribution a priori par défaut faiblement informative pour les modèles logistiques et autres modèles de régression. The Annals of Applied Statistics, 2 (4), 1360–1383.
la source
C'est ce qui le rend bayésien. Le modèle génératif pour les données est le même; la différence est qu'une analyse bayésienne choisit une distribution antérieure pour les paramètres d'intérêt, et calcule ou se rapproche d'une distribution postérieure , sur laquelle toute inférence est basée. La règle de Bayes relie les deux: le postérieur est proportionnel aux temps de vraisemblance antérieurs.
Intuitivement, cet a priori permet à un analyste d'exprimer mathématiquement une expertise en la matière ou des résultats préexistants. Par exemple, le texte auquel vous faites référence indique que le précédent pour est une normale multivariée. Des études antérieures suggèrent peut-être une certaine gamme de paramètres qui peuvent être exprimés avec certains paramètres normaux. (La flexibilité s'accompagne de la responsabilité: il faut être en mesure de justifier ses antécédents devant un public sceptique.) Dans des modèles plus élaborés, on peut utiliser l'expertise du domaine pour régler certains paramètres latents. Par exemple, voir l'exemple du foie référencé dans cette réponse .β
Certains modèles fréquentistes peuvent être liés à un homologue bayésien avec un a priori spécifique, bien que je ne sache pas qui correspond dans ce cas.
la source