AUC en régression logistique ordinale

9

J'utilise 2 types de régression logistique - l'un est le type simple, pour la classification binaire, et l'autre est la régression logistique ordinale. Pour calculer la précision de la première, j'ai utilisé la validation croisée, où j'ai calculé l'AUC pour chaque pli et ensuite calculé l'ASC moyenne. Comment puis-je le faire pour la régression logistique ordinale? J'ai entendu parler de ROC généralisé pour les prédicteurs multi-classes, mais je ne sais pas comment le calculer.

Merci!

Noam Peled
la source
1
pas AUC mais liés: sur les courbes de rappel de précision micro / macro sur stats.stackexchange.com/questions/21551/…
Yevgeny

Réponses:

4

J'aime seulement la zone sous la courbe ROC ( index) car il se trouve que c'est une probabilité de concordance. c est un élément constitutif des coefficients de corrélation de rang. Par exemple, Somers D x y = 2 × ( c - 1cc. Pour l'ordinalY,Dxyest une excellente mesure de la discrimination prédictive, et lepackageRfournit des moyens faciles d'obtenir des estimations corrigées du sur-ajustement bootstrap deDxy. Vous pouvez effectuer une résolution arrière pour unindexcgénéralisé (AUROC généralisé). Il y araisonsne pas considérer chaque niveau deYséparémentcar cela n'exploite pas la nature ordinale deY.Xy=2×(c-12)OuiXyrmsXycOuiOui

Il rmsexiste deux fonctions de régression ordinale: lrmet orm, cette dernière gère continu et fournit plus de familles de distribution (fonctions de liaison) que de cotes proportionnelles.Oui

Frank Harrell
la source
La question principale sera de savoir comment rms calcule le utilisé dans Sommer D x y ? c-jeneXXy
Chamberlain Foncha
1
Il est orthographié Somer . L' index généralisé est simplement calculé en résolvant l'équation I ci-dessus. En interne, toutes les combinaisons possibles d'observations ayant des valeurs Y différentes sont examinées, et la fraction de ces paires pour lesquelles les prévisions sont dans le même ordre est l'estimation de la probabilité de concordance. J'ai déformé une chose: la fonction utilise le ρ de Spearman au lieu de D x y . cOuiormρXy
Frank Harrell
Merci pour la correction orthographique. Dans la régression ordinale, il sera beaucoup plus intéressant non seulement de regarder l'ordre par paire comme cela se fait dans la fonction orm que vous avez mentionnée, mais aussi de regarder l'ordre cohérent (avec des opérateurs ternaires ou supérieurs) en fonction du nombre de classes que vous avez. En résumé, ce que je dis est: avec une régression logistique cumulative ajustée par exemple, l'ordre des classes est pris en charge dans le modèle. Une mesure prédictive devrait également pouvoir ne pas faire de comparaison par paire P(pre1<pre2|obs1<obs2)mais comparaison de la forme $ P (pred_1 <pred_2 <pred_3 | obs_1 <obs_2 <o
Chamberlain Foncha
Ne connaissant pas ces mesures, ma première réaction est qu'elles placent la barre haute au niveau des obstacles.
Frank Harrell
1

L'AUC pour la régression ordinale est quelque chose de délicat. Vous voudrez peut-être calculer l'AUC pour chaque classe en créant des variables muettes pour prendre la valeur 1 pour la classe que vous calculez l'AUC et 0 pour le reste des autres classes. Si vous avez 4 classes, vous allez créer 4 AUC et les tracer sur le même graphique. Le principal problème de cette méthode est qu'elle pénalise également la mauvaise classification. Il est bien plus intuitif de classer par erreur une classe 1 en classe 3 que de classer par erreur une classe 1 en classe 2.

Chamberlain Foncha
la source