Quand utiliser les réseaux bayésiens par rapport à d'autres approches d'apprentissage automatique?

12

J'espère qu'il n'y aura peut-être pas de réponse définitive à cette question. Mais j'ai utilisé un certain nombre d'algorithmes d'apprentissage automatique dans le passé et j'essaie d'en apprendre davantage sur les réseaux bayésiens. Je voudrais comprendre dans quelles circonstances ou pour quels types de problèmes choisiriez-vous d'utiliser le réseau bayésien par rapport à d'autres approches?

AndyC
la source
3
Les réseaux bayésiens sont pour moi un moyen de définir les indépendances conditionnelles dans un modèle. Une fois que vous avez défini cela, je suppose que vous pouvez utiliser divers outils d'apprentissage pour estimer les paramètres du modèle. Donc, je vois une nette séparation entre l'apprentissage des paramètres et le modèle. Cependant, je ne suis pas un expert en la matière, donc quelqu'un peut venir avec une meilleure réponse.
Luca

Réponses:

7

XYP(X,Y)P(Y|X)

P(X1|Y)P(X1|X2=A,X3=B)P(Y|X)

Les BN utilisent les DAG pour prescrire la distribution conjointe. Ce sont donc des modèles graphiques.

Avantages:

  1. Lorsque vous avez beaucoup de données manquantes, par exemple en médecine, les NE peuvent être très efficaces car la modélisation de la distribution conjointe (c'est-à-dire votre affirmation sur la façon dont les données ont été générées) réduit votre dépendance à avoir un ensemble de données entièrement observé.

  2. causeeffect

  3. Apprendre la distribution conjointe est une tâche difficile, mais la modéliser pour des variables discrètes (par le calcul de tables de probabilités conditionnelles, c'est-à-dire les CPT) est beaucoup plus facile que d'essayer de faire de même pour des variables continues. Les BN sont donc pratiquement plus courants avec des variables discrètes.

  4. Les NE permettent non seulement l'inférence observationnelle (comme le permettent tous les modèles d'apprentissage automatique), mais aussi les interventions causales . Il s'agit d'un avantage communément négligé et sous-estimé des NE et lié au raisonnement contrefactuel.

Zhubarb
la source
1
Dans l'avantage 1 où vous dites que les BN sont efficaces pour modéliser des données avec beaucoup de valeurs manquantes, ces valeurs manquantes n'affectent-elles pas l'identification correcte des indépendances dans les données?
Hossein
1
P(Y,X1,X2)X1X2
1

D'après mon expérience, les réseaux bayésiens fonctionnent très bien lorsqu'il existe des données catégorielles de grande dimension . Ils donnent des modèles interprétables, qui (parfois) aident à comprendre comment les différentes variables interagissent.

bronzer
la source