J'ai une mission d'exploration de données où je crée un système de récupération d'images basé sur le contenu. J'ai 20 images de 5 animaux. Donc au total 100 images.
Mon système renvoie les 10 images les plus pertinentes à une image d'entrée. Je dois maintenant évaluer les performances de mon système avec une courbe de précision-rappel. Cependant, je ne comprends pas le concept de courbe de précision-rappel. Disons que mon système retourne 10 images pour une image de gorille, mais seulement 4 d'entre elles sont des gorilles. Les 6 autres images retournées sont d'autres animaux ». Donc,
- la précision est
4/10 = 0.4
(relevés renvoyés) / (tous retournés) - rappel est
4/20 = 0.2
(relevés retournés) / (tous relevants)
Je n'ai donc qu'un point <0.2,0.4>
, pas une courbe. Comment puis-je avoir une courbe (c'est-à-dire un ensemble de points)? Dois-je changer le nombre d'images retournées (celui-ci est fixé à 10 dans mon cas)?
Réponses:
La génération d'une courbe PR est similaire à la génération d'une courbe ROC. Pour dessiner de tels graphiques, vous avez besoin d'un classement complet de l'ensemble de test. Pour faire ce classement, vous avez besoin d'un classificateur qui génère une valeur de décision plutôt qu'une réponse binaire. La valeur de décision est une mesure de confiance dans une prédiction que nous pouvons utiliser pour classer toutes les instances de test. À titre d'exemple, les valeurs de décision de la régression logistique et du SVM sont respectivement une probabilité et une distance (signée) par rapport à l'hyperplan de séparation.
Si j'ai bien compris votre commentaire, le score de similitude total que vous calculez peut être utilisé comme valeur de décision.
la source