Le coefficient de dés est-il le même que la précision?

Je rencontre le coefficient de dés pour la similitude du volume ( https://en.wikipedia.org/wiki/S%C3%B8rensen%E2%80%93Dice_coefficient ) et la précision ( https://en.wikipedia.org/wiki/Accuracy_and_precision ).

Il me semble que ces deux mesures sont identiques. Des pensées?

descriptive-statistics roc accuracy precision-recall auc RockTheStar
la source

Cela fournit toutes les informations stats.stackexchange.com/questions/195006/…

rank1

@ rank1 Merci. Je veux clarifier: n'est-ce pas le lien vers ma question :)

RockTheStar

ooops, celui-ci: ncbi.nlm.nih.gov/pmc/articles/PMC4533825

rang1

Réponses:

Ce ne sont pas la même chose et ils sont souvent utilisés dans des contextes différents. Le score Dice est souvent utilisé pour quantifier les performances des méthodes de segmentation d'image . Là, vous annotez une région de vérité au sol dans votre image, puis créez un algorithme automatisé pour le faire. Vous validez l'algorithme en calculant le score de dés, qui est une mesure de la similitude des objets. C'est donc la taille du chevauchement des deux segmentations divisée par la taille totale des deux objets. En utilisant les mêmes termes que pour décrire la précision, le score de dés est:

Score de dés = \frac{2 \cdot nombre de vrais positifs}{2 \cdot nombre de vrais positifs + nombre de faux positifs + nombre de faux négatifs}

$\text{Dice score} = \frac{2\cdot \text{number of true positives}}{2 \cdot \text{number of true positives + number of false positives + number of false negatives}}$ Donc le nombre de vrais positifs, c'est le nombre que votre méthode trouve, le nombre de positifs est le nombre total de positifs qui peuvent être trouvés et le nombre de faux positifs est le nombre de points négatifs que votre méthode classe comme positifs.

Le score de dés est non seulement une mesure du nombre de positifs que vous trouvez, mais il pénalise également les faux positifs que la méthode trouve, de manière similaire à la précision. il est donc plus semblable à la précision qu'à la précision. La seule différence est le dénominateur, où vous avez le nombre total de positifs au lieu des seuls positifs détectés par la méthode. Ainsi, le score de dés pénalise également les points positifs que votre algorithme / méthode n'a pas pu trouver.

Modifier: dans le cas de la segmentation d'image, disons que vous avez un masque avec la vérité du sol, appelons le masque $A$ comme vous le suggérez. Le masque a donc la valeur 1 dans les pixels où il y a quelque chose que vous essayez de trouver et sinon zéro. Vous avez maintenant un algorithme pour générer l'image / le masque $B$ , qui doit également être une image binaire, c'est-à-dire que vous créez un masque pour votre segmentation. Ensuite nous avons le suivant:

Le nombre de positifs est le nombre total de pixels qui ont l'intensité 1 dans l'image $A$
$A$ $B$ $A$ $B$ $A$ $B$
$B$ $A$

Si vous faites cela pour une publication, écrivez Dice avec un D majuscule, car il porte le nom d'un gars nommé Dice.

EDIT: Concernant le commentaire sur une correction: je n'utilise pas la formule traditionnelle pour calculer le coefficient de dés, mais si je le traduis dans la notation dans l'autre réponse, il devient:

Score de dés = \frac{2 \cdot | UNE \cap B |}{2 \cdot | UNE \cap B | + | B ∖ UNE | + | UNE ∖ B |}

$\text{Dice score} = \frac{2\cdot|A\cap B|}{2\cdot|A\cap B| + |B\backslash A| + |A\backslash B|}$

Ce qui équivaut à la définition traditionnelle. Il est plus pratique de l'écrire comme je l'ai écrit à l'origine pour énoncer la formule en termes de faux positifs. La barre oblique inverse est le moins défini.

Gumeo
la source

Merci pour la réponse. Exactement pour la comparaison de segmentation d'image. Donc, ce score de dés est utilisé, disons, donne l'image A et l'image B. L'image A est le sol vrai (0 ou 1), et l'image B est ma segmentation. Alors, quel est le nombre total de positifs (1), c'est que le nombre de 1 dans A + nombre de 1 dans B ?? Je suis un peu confus ici. Identique au faux positif

RockTheStar

@RockTheStar Je vais modifier ma réponse pour tenir compte de la segmentation de l'image.

Gumeo

Très bien, merci beaucoup pour votre explication. Encore une question de suivi. Et la gamme D? Est-ce entre 0 et 1?

RockTheStar

Grand merci! Le

mettra en

@Gumeo vous voudrez peut-être corriger ou au moins expliquer votre réponse, veuillez consulter ma nouvelle réponse pour plus de détails

dvb

Le coefficient de dés (également appelé indice de similitude des dés) est le même que le score F1 , mais ce n'est pas la même chose que la précision. La principale différence pourrait être le fait que la précision prend en compte les vrais négatifs tandis que le coefficient de dés et de nombreuses autres mesures ne traitent que les vrais négatifs comme des défauts par défaut sans intérêt (voir Les principes de base de l'évaluation des classificateurs, partie 1 ).

Pour autant que je sache, le coefficient de dés n'est pas calculé comme décrit par une réponse précédente , qui contient en fait la formule de l' indice de Jaccard (également connu sous le nom d '«intersection sur l'union» en vision par ordinateur).

\begin{aligned} ré je c e (UNE, B) & = \frac{2 | UNE \cdot B |}{| UNE | + | B |} \\ F 1 (UNE, B) & = \frac{2}{| UNE | / | UNE \cdot B | + | B | / | UNE \cdot B |} \\ J une c c une r ré (UNE, B) & = \frac{| UNE \cdot B |}{| m une X (UNE, B) |} = \frac{| UNE \cdot B |}{| UNE | + | B | - | UNE \cdot B |} \\ UNE c c u r une c y (UNE, B) & = \frac{| UNE \cdot B | + | \bar{UNE} \cdot \bar{B} |}{| UNE l l |} \end{aligned}

$\begin{align*} Dice(A,B) &= \frac{2|A\cdot B|}{ |A| + |B| } \\ F1(A,B) &= \frac{2}{|A|/|A \cdot B| + |B|/|A\cdot B|} \\ Jaccard(A,B) &= \frac{|A\cdot B|}{|max(A,B)|} = \frac{|A\cdot B|}{|A|+|B|-|A\cdot B|}\\ Accuracy(A,B) &= \frac{|A\cdot B|+|\overline{A} \cdot \overline{B}|}{|All|} \\ \end{align*}$

$A,B$ $All$ $|A \cdot B|$ $A$ $B$ $|\overline{A} \cdot \overline{B}|$ $A$ $B$

Le coefficient de dés et l'indice de Jaccard sont liés de façon monotone, et l'indice Tversky les généralise tous les deux, pour en savoir plus à ce sujet, voir les scores F, les dés et la similitude des ensembles de Jaccard .

Le coefficient de dés est également la moyenne harmonique de la sensibilité et de la précision, pour voir pourquoi il est logique, lisez Pourquoi la mesure F est-elle une moyenne harmonique et non une moyenne arithmétique des mesures de précision et de rappel? .

Pour en savoir plus sur de nombreux termes de cette réponse et leurs relations, voir Évaluation des classificateurs binaires .

dvb
la source