Régression logistique pour les données des distributions de Poisson

11

À partir de quelques notes d'apprentissage automatique parlant de certaines méthodes de classification discriminantes, en particulier la régression logistique, où y est l'étiquette de classe (0 ou 1) et x les données, il est dit que:

si x|y=0Poisson(λ0) , et x|y=1Poisson(λ1) , alors p(y|x) sera logistique.

Pourquoi est-ce vrai?

sambajetson
la source

Réponses:

16

Y a deux valeurs possibles pour toute valeur donnée de X . Selon les hypothèses,

Pr(X=x|Y=0)=exp(λ0)λ0xx!

et

Pr(X=x|Y=1)=exp(λ1)λ1xx!.

Par conséquent (il s'agit d'un cas trivial du théorème de Bayes), la probabilité que conditionnel à soit la probabilité relative de ce dernier, à savoirY=1X=x

Pr(Y=1|X=x)=exp(λ1)λ1xx!exp(λ1)λ1xx!+exp(λ0)λ0xx!=11+exp(β0+β1x)

β0=λ1λ0

et

β1=log(λ1/λ0).

Il s'agit bien du modèle de régression logistique standard.

whuber
la source