J'ai obtenu le modèle de régression logistique pour multiclasses qui est donné par
où k est le nombre de classes thêta est le paramètre à estimer j est la jième classe Xi est les données d'entraînement
Eh bien, je n'ai pas compris comment le dénominateur partie normalisé le modèle. Je veux dire que la probabilité reste entre 0 et 1.
Je veux dire que je suis habitué à la régression logistique étant
En fait, je suis confus avec la question de la nomination. Dans ce cas, car il s'agit d'une fonction sigmoïde, elle ne laisse jamais la valeur inférieure à 0 ou supérieure à 1. Mais je suis confus dans le cas de plusieurs classes. Pourquoi en est-il ainsi?
Ceci est ma référence https://list.scms.waikato.ac.nz/pipermail/wekalist/2005-F February/ 029738.html . Je pense que cela aurait dû être de normaliser
la source
Réponses:
Votre formule est fausse (la limite supérieure de la somme). Dans la régression logistique avec classes ( ), vous créez essentiellement des modèles de régression logistique binaire où vous choisissez une classe comme référence ou pivot. Habituellement, la dernière classe est sélectionnée comme référence. Ainsi, la probabilité de la classe de référence peut être calculée parLa forme générale de la probabilité estComme la -ième classe est votre référence et doncK > 2 K - 1 K P ( y i = K | x i ) = 1 - K - 1 ∑ k = 1 P ( y i = k | x i ) . P ( y i = k | x i ) = exp ( θ T i x i )K K> 2 K- 1 K
la source
Je pense que vous êtes confus par une faute de frappe: votre devrait être dans la première équation. Les 1 que vous voyez dans le cas logistique sont en fait s, par exemple, quand il y a un th . k - 1 exp ( 0 ) k θ = 0k k - 1 exp( 0 ) k θ = 0
Supposons que . Notez maintenant que vous pouvez passer de la dernière formulation à la version de régression logistique comme Pour plusieurs classes, remplacez simplement le dénominateur dans les deux premières quantités par une somme sur les prédicteurs linéaires exponentiels. exp ( b )θ1X=b
la source