Disons que j'essaie de découvrir la probabilité que la saveur de crème glacée préférée de quelqu'un soit la vanille.
Je sais que la personne aime aussi les films d'horreur.
Je veux découvrir la probabilité que la crème glacée préférée de la personne soit de la vanille étant donné qu'elle aime les films d'horreur.
Je connais les choses suivantes:
- P ( A ) des personnes choisissent la vanille comme leur saveur de crème glacée préférée. (Ceci est mon )
- P ( B | A ) des personnes dont la préférée est la glace à la vanille aiment aussi les films d'horreur. (Ceci est mon )
- P ( B | ¬ A ) des personnes dont la préférée n'est pas la glace à la vanille aiment aussi les films d'horreur (This is my )
Donc, je le calcule comme ceci: Je trouve que (arrondi au dix millième le plus proche). Il y a chances que la saveur de crème glacée préférée d'un fan de film d'horreur soit la vanille. P(A|B)=0,344834,48%
Mais ensuite, j'apprends que la personne a vu un film d'horreur au cours des 30 derniers jours. Voici ce que je sais:
- est la probabilité postérieure actualisée que la vanille est l'arôme de crème glacée préféré de la personne - le dans ce problème suivant.
- des personnes dont la préférée est la glace à la vanille ont vu un film d'horreur au cours des 30 derniers jours.
- des personnes dont la préférée n'est pas la glace à la vanille ont vu un film d'horreur au cours des 30 derniers jours.
Cela donne: fois arrondi.
Alors maintenant, je crois qu'il y a chances que le fan de film d'horreur aime la crème glacée étant donné qu'il a vu un film d'horreur au cours des 30 derniers jours.
Mais attendez, il y a autre chose. J'ai également appris que la personne possède un chat.
Voici ce que je sais:
- est la probabilité postérieure actualisée que la vanille est la saveur de crème glacée préférée de la personne - le dans ce problème suivant
- des personnes dont la crème glacée à la vanille est également propriétaire de chats
- des personnes dont la préférée n'est pas la glace à la vanille possèdent également des chats
Cela donne: fois arrondi.
Ma question se résume à ceci: est-ce que je mets correctement à jour la probabilité en utilisant le théorème de Bayes? Suis-je en train de me tromper dans mes méthodes?
la source
Réponses:
Ce n'est pas correct. La mise à jour séquentielle de ce type ne fonctionne que lorsque les informations que vous recevez séquentiellement sont indépendantes (par exemple, les observations iid d'une variable aléatoire). Si chaque observation n'est pas indépendante, comme dans ce cas, vous devez considérer la distribution de probabilité conjointe. La bonne façon de mettre à jour serait de revenir à la précédente, de trouver la probabilité commune que quelqu'un aime les films d'horreur, ait vu un film d'horreur au cours des 30 derniers jours et possède un chat étant donné qu'il choisit ou non la vanille comme saveur de crème glacée préférée, puis mettez à jour en une seule étape.
La mise à jour séquentielle comme celle-ci lorsque vos données ne sont pas indépendantes entraînera rapidement une probabilité postérieure bien supérieure ou inférieure à ce qu'elle devrait être.
la source