J'ai un problème de classification binaire et j'expérimente différents classificateurs dessus: je veux comparer les classificateurs. lequel est une meilleure mesure de l'ASC ou de la précision? Et pourquoi?
Raondom Forest: AUC: 0.828 Accuracy: 79.6667 %
SVM: AUC: 0.542 Accuracy: 85.6667 %
Je pense que vous devriez certainement examiner plus de mesures que l'ASC et la précision.
La précision (ainsi que la sensibilité et la spécificité) est une métrique très simple mais biaisée qui vous oblige à regarder le résultat de prédiction absolu et ne vous permet pas d'affirmer les probabilités de classe ou le classement. Il ne prend pas non plus en compte la population qui invite à une mauvaise interprétation car un modèle donnant une précision de 95% sur une population avec 95% de chance d'être correct au hasard n'est pas vraiment un bon modèle, même si la précision est élevée.
L'ASC est une bonne mesure pour affirmer la précision du modèle qui est indépendante des probabilités de classe de population. Cependant, cela ne vous dira rien sur la qualité réelle des estimations de probabilité. Vous pourriez obtenir une ASC élevée mais avoir des estimations de probabilité très biaisées. Cette métrique est plus discriminante que la précision et vous donnera certainement de meilleurs modèles lorsqu'elle est utilisée en combinaison avec une règle de notation appropriée, par exemple le score de Brier comme mentionné dans un autre article.
Vous pouvez obtenir une preuve plus formelle ici, bien que cet article soit assez théorique: l' AUC: une mesure statistiquement cohérente et plus discriminante que la précision
Il existe cependant un tas de bonnes mesures disponibles. Fonctions de perte pour l'estimation et la classi fi cation des probabilités des classes binaires: structure et applications est un bon article qui étudie les règles de notation appropriées telles que le score de Brier.
Un autre article intéressant avec des métriques pour l'affirmation de la performance du modèle est l' évaluation: de la précision, du rappel et de la mesure F au ROC, la connaissance, la netteté et la corrélation reprenant d'autres bonnes mesures de performance telles que la connaissance.
Pour résumer, je recommanderais de regarder les scores AUC / Gini et Brier pour affirmer les performances de votre modèle, mais selon l'objectif avec votre modèle, d'autres mesures pourraient mieux convenir à votre problème.
la source