J'étudie «Introduction à l'apprentissage statistique» par James, Witten, Hastie, Tibshirani.
À la page 139 de leur livre, ils ont commencé par présenter le théorème de Bayes . n'est pas une constante mathématique, mais indique la probabilité antérieure. Rien n'est étrange dans cette équation.
Le livre prétend qu'il veut obtenir une estimation de qu'il puisse brancher dans l'équation donnée ci-dessus. Pour estimer , il suppose que c'est normal. Dans le cadre unidimensionnel, , où et sont la moyenne et la variance pour la ème classe. On suppose que . (J'ai commencé à me perdre dans la dernière déclaration.)
En dans , vous avez cette équation assez compliquée (1):
Encore une fois, pas de surprise ici car il ne s'agit que de substitution.
Le classificateur de Bayes consiste à attribuer une observation à la classe pour laquelle l'équation (1) est la plus grande. En prenant le log de l'équation (1) et en réarrangeant les termes, il n'est pas difficile de montrer que cela équivaut à attribuer l'observation à la classe pour laquelle ce qui suit est le plus grand:
Question: Je ne comprends pas d'où cela vient et ce que cela signifie. J'ai essayé de faire le log de l'équation et ça ne devient pas ça. Prenons-nous la dérivée quelque part ici, puisque c'est la plus grande observation?