Pourquoi utiliser l'AUC?

10

Surtout du côté informatique de la littérature sur l'apprentissage automatique, l'ASC (aire sous la courbe caractéristique de l'opérateur du récepteur) est un critère populaire pour évaluer les classificateurs. Quelles sont les justifications de l'utilisation de l'AUC? Par exemple, existe-t-il une fonction de perte particulière pour laquelle la décision optimale est le classificateur avec la meilleure AUC?

charles.y.zheng
la source
1
L'AUC est une fonction de perte, il est clair que pour cette fonction de perte la décision optimale est le classificateur avec la meilleure AUC.
robin girard
1
@robingirard Non, ce n'est pas le cas, car il n'est pas différenciable, c'est-à-dire que vous ne pouvez pas l'optimiser directement.
cpury

Réponses:

15

Pour les classificateurs binaires utilisés pour le classement (c'est-à-dire pour chaque exemple nous avons dans l'intervalle ) à partir duquel l'ASC est mesurée, l'ASC est équivalente à la probabilité que où est un véritable exemple positif et est un véritable exemple négatif. Ainsi, le choix d'un modèle avec l'ASC maximale minimise la probabilité que . C'est-à-dire, minimise la perte de classement d'un vrai négatif au moins aussi grand qu'un vrai positif.CeC(e)[0,1]C(e1)>C(e0)e1e0C(e0)C(e1)

erik
la source
0

Prenons un exemple simple d'identification d'une bonne tomate à partir d'un pool de bonnes + mauvaises tomates. Disons que le nombre de bonnes tomates est de 100 et que les mauvaises tomates sont de 1000, donc un total de 1100. Maintenant, votre travail consiste à identifier autant de bonnes tomates que possible. Une façon d'obtenir toutes les bonnes tomates est de prendre les 1100 tomates. Mais cela indique clairement que vous n'êtes pas en mesure de différencier b / n bon contre mauvais .

Alors, quelle est la bonne façon de différencier - besoin d'obtenir autant de bons tout en ramassant très peu de mauvais , donc nous avons besoin d'une mesure quelque chose, qui peut dire combien de bons nous avons ramassés et aussi dire ce qui compte dans les mauvais il. La mesure de l'AUC donne plus de poids si elle est capable de sélectionner plus de bons avec peu de mauvais comme illustré ci-dessous. qui indique à quel point vous êtes capable de différencier b / n bon et mauvais.

Dans l'exemple, vous pouvez observer qu'en ramassant 70% de bonnes tomates, la courbe noire a ramassé environ 48% de mauvaises (impuretés), mais la bleue a 83% de mauvaises (impuretés). La courbe noire a donc un meilleur score AUC que la courbe bleue. entrez la description de l'image ici

yugandhar
la source
Comment cela répond-il à la question?
Vivek Subramanian le
J'avais écrit avec l'intuition de l'AUC que cela aide à donner un score unique pour identifier les bons (1 dans la classification binaire) dans toute la population tout en réduisant le nombre de faux positifs. Aidez-moi comment aurais-je pu faire mieux pour cela.
yugandhar