J'essaie de comprendre quel est le but de la fonction de perte et je ne comprends pas très bien.
Donc, pour autant que je sache, la fonction de perte consiste à introduire une sorte de métrique avec laquelle nous pouvons mesurer le "coût" d'une décision incorrecte.
Disons que j'ai un ensemble de données de 30 objets, je les ai divisés en ensembles de formation / test comme 20/10. J'utiliserai la fonction de perte 0-1, alors disons que mon ensemble d'étiquettes de classe est M et que la fonction ressemble à ceci :
J'ai donc construit un modèle sur mes données d'entraînement, disons que j'utilise le classificateur Naive Bayes, et ce modèle a classé correctement 7 objets (en leur attribuant les étiquettes de classe correctes) et 3 objets ont été classés incorrectement.
Donc, ma fonction de perte retournerait "0" 7 fois et "1" 3 fois - quel genre d'informations puis-je obtenir de cela? Que mon modèle a classé incorrectement 30% des objets? Ou y a-t-il plus?
S'il y a des erreurs dans ma façon de penser, je suis vraiment désolé, j'essaie juste d'apprendre. Si l'exemple que j'ai donné est "trop abstrait", faites-le moi savoir, je vais essayer d'être plus précis. Si vous essayez d'expliquer le concept à l'aide d'un exemple différent, veuillez utiliser la fonction de perte 0-1.
la source
Oui, c'est fondamentalement ça: vous comptez le nombre d'articles mal classés. Il n'y a plus rien derrière, c'est une fonction de perte très basique. Ce qui suit, une perte de 0-1 conduit à une estimation du mode de la distribution cible (par rapport àL1 perte pour estimer la médiane et L2 perte pour estimer la moyenne).
la source
Je pense que votre confusion ne fait pas la différence entre la perte d'un point de données et la perte de l'ensemble de données.
Plus précisément, votreL ( y, y^) est la perte d'un point de données (je modifie un peu la notation). Et la perte pour l'ensemble des données, c'est-à-dire la précision de la classification, doit additionner tous les points de données.
la source