seuil de calcul pour le classificateur de risque minimum?

11

Supposons que deux classes et ont un attribut et ont la distribution et . si nous avons égal pour la matrice de coût suivante:C1C2xN(0,0.5)N(1,0.5)P(C1)=P(C2)=0.5

L=[00.510]

pourquoi, est le seuil du classificateur de risque (coût) minimum?x0<0.5

Ceci est mon exemple de note que je comprends mal (c.-à-d. Comment ce seuil est atteint?)

Edit 1: Je pense que pour les seuils de rapport de vraisemblance, nous pouvons utiliser P (C1) / P (C2).

Edit 2: J'ajoute de Duda Book on Pattern du texte sur le seuil. entrez la description de l'image ici

user153695
la source

Réponses:

4

Pour une matrice de coûts

L=[00.510]c1c2predictionc1c2truth

la perte de prédire la classe lorsque la vérité est la classe est , et le coût de prédire la classe lorsque la vérité est la classe est . Il n'y a aucun coût pour des prédictions correctes, . Le risque conditionnel pour prédire l'une ou l'autre classe est alorsc 2 L 12 = 0,5 c 2 c 1 L 21 = 1 L 11 = L 22 = 0 R kc1c2L12=0.5c2c1L21=1L11=L22=0Rk

R(c1|x)=L11Pr(c1|x)+L12Pr(c2|x)=L12Pr(c2|x)R(c2|x)=L22Pr(c2|x)+L21Pr(c1|x)=L21Pr(c1|x)
Pour un référence voir ces notes à la page 15.

Afin de minimiser le risque / la perte, vous prédisez si le coût de l'erreur de le faire (c'est la perte de la mauvaise prédiction multiplié par la probabilité postérieure que la prédiction est fausse ) est inférieur au coût de la prévision erronée de l'alternative,c1L12Pr(c2|x)

L12Pr(c2|x)<L21Pr(c1|x)L12Pr(x|c2)Pr(c2)<L21Pr(x|c1)Pr(c1)L12Pr(c2)L21Pr(c1)<Pr(x|c1)Pr(x|c2)
où la deuxième ligne utilise la règle de Bayes . À probabilités antérieures égales vous obtenez Pr(c2|x)Pr(x|c2)Pr(c2)Pr(c1)=Pr(c2)=0.5
12<Pr(x|c1)Pr(x|c2)

vous choisissez donc de classer une observation car est le rapport de vraisemblance supérieur à ce seuil. Maintenant, il n'est pas clair pour moi si vous vouliez connaître le "meilleur seuil" en termes de rapports de vraisemblance ou en termes d'attribut . La réponse change en fonction de la fonction de coût. Utilisation du gaussien dans l'inégalité avec et , , c1xσ1=σ2=σμ1=0μ2=1

12<12πσexp[12σ2(xμ1)2]12πσexp[12σ2(xμ2)2]log(12)<log(12πσ)12σ2(x0)2[log(12πσ)12σ2(x1)2]log(12)<x22σ2+x22σ22x2σ2+12σ2xσ2<12σ2log(12)x<12log(12)σ2
donc un seuil de prédiction en termes dexque vous recherchez ne peut être atteint que si les pertes résultant de fausses prédictions sont les mêmes, c.-à-d. car alors seulement vous pouvez avoir et vous obtenez le .L12=L21log(L12L21)=log(1)=0x0<12
Andy
la source
Belle réponse, mais m'a confondu! si vous voulez choisir ou , lequel est correct? x0=0.5x0<0.5
user153695
Donc, juste sur la frontière de décision vous ne pouvez pas dire exactement si une observation doit être dans la classe un ou deux (car elle est exactement sur la frontière). Donc, choisissez si l'observation doit être dans la classe 1 si ou vous appartient. Avec des échantillons suffisamment grands, cela devrait se produire pour très peu d'observations, donc à la marge, il importera de la litière pour votre résultat. x0=0.5ix00.5x0<0.5
Andy
tout mon problème qui lui a valu la générosité avec mon prof. calculé et n'accepte pas s'il vous plaît voir ma modification en question, je seuil mince devrait être . x0<0.5x0=0.5x0<0.5
user153695
peut-être 0,5 ln :)
user153695
1
@whuber merci, j'ai complètement raté ça, alors je suis parti d'une mauvaise fin.
Andy