Précision moyenne et rappel lors de l'utilisation de la validation croisée

11

J'ai effectué une classification en utilisant plusieurs classificateurs pour des données étiquetées à 2 classes, et j'ai utilisé une validation croisée 5 fois. Pour chaque pli, j'ai calculé tp, tn, fp et fn. Ensuite, j'ai calculé l'exactitude, la précision, le rappel et le score F pour chaque test. Ma question est la suivante: lorsque je veux faire la moyenne des résultats, j'ai pris la moyenne des précisions, mais puis-je également faire la moyenne de la précision, du rappel et du score F? Ou serait-ce mathématiquement incorrect? PS Les jeux de données utilisés dans chaque pli sont bien équilibrés en termes de nombre d'instances par classe.

Merci.

Kalaji
la source
3
J'ai rencontré votre même problème concernant le calcul de la mesure F (moyenne harmonique de précision et de rappel) en utilisant la validation croisée. Dans cet article, ils ont en fait démontré que le calcul de la mesure F sur l'ensemble complet, et non la moyenne, est la méthode la moins biaisée. J'espère que cela peut aider
papafe
3
@markusian Veuillez ajouter ceci comme réponse! C'est de loin la chose la plus importante sur cette page !!
drevicko

Réponses:

2

F

F1=2precisionrecallprecision+recall
Fββ
Fβ=(1+β2)precisionrecall(β2precision)+recall
F

tFF

Matt Krause
la source
Oui, j'ai utilisé la première formule. Cela signifie que la moyenne du score F des différents tests donne des résultats similaires à la moyenne de précision et de rappel, puis le calcul du score F à partir d'eux. J'ai essayé cela sur les résultats que j'ai et c'était presque la même chose. Merci.
Kalaji