La direction des bords dans un réseau Bayes n'est-elle pas pertinente?

10

Aujourd'hui, dans une conférence, il a été affirmé que la direction des bords dans un réseau Bayes n'a pas vraiment d'importance. Ils n'ont pas à représenter la causalité.

Il est évident que vous ne pouvez pas commuter un seul front dans un réseau Bayes. Par exemple, supposons que avec et . Si vous basculez sur , alors ne sera plus acyclique et donc pas un réseau Bayes. Cela semble être principalement un problème pratique pour estimer ensuite les probabilités. Ce cas semble être beaucoup plus difficile à répondre, je vais donc l'ignorer.V = { v 1 , v 2 , v 3 } E = { ( v 1 , v 2 ) , ( v 1 , v 3 ) , ( v 2 , v 3 ) } ( v 1 , v 3 ) ( v 3 , v 1 ) GG=(V,E)V={v1,v2,v3}E={(v1,v2),(v1,v3),(v2,v3)}(v1,v3)(v3,v1)G

Cela m'a fait poser les questions suivantes pour lesquelles j'espère avoir des réponses ici:

  1. Est-il possible pour tout graphe acyclique dirigé (DAG) d'inverser tous les bords et d'avoir toujours un DAG?
  2. Supposons un DAG et les données sont fournies. Nous construisons maintenant l'inverse DAG . Pour les deux DAG, nous adaptons les données aux réseaux Bayes correspondants. Nous avons maintenant un ensemble de données pour lesquelles nous voulons utiliser le réseau Bayes pour prédire les attributs manquants. Pourrait-il y avoir des résultats différents pour les deux DAG? (Bonus si vous venez avec un exemple)G invGGinv
  3. Similaire à 2, mais plus simple: Supposons un DAG et les données sont données. Vous pouvez créer un nouveau graphique en inversant n'importe quel ensemble d'arêtes, tant que reste acyclique. Les réseaux bayésiens sont-ils équivalents en ce qui concerne leurs prévisions?G G GGG
  4. Avons-nous quelque chose si nous avons des bords qui représentent la causalité?
Martin Thoma
la source

Réponses:

6

TL; DR: parfois, vous pouvez créer un réseau bayésien équivalent en inversant les flèches, et parfois vous ne pouvez pas.

Une simple inversion de la direction des flèches donne un autre graphique orienté, mais ce graphique n'est pas nécessairement le graphique d'un réseau bayésien équivalent, car les relations de dépendance représentées par le graphique à flèche inversée peuvent être différentes de celles représentées par le graphique d'origine. Si le graphique à flèche inversée représente des relations de dépendance différentes de l'original, dans certains cas, il est possible de créer un réseau bayésien équivalent en ajoutant des flèches supplémentaires pour capturer les relations de dépendance manquantes dans le graphique à flèche inversée. Mais dans certains cas, il n'y a pas de réseau bayésien exactement équivalent. Si vous devez ajouter des flèches pour capturer les dépendances,

Par exemple, a -> b -> creprésente les mêmes dépendances et indépendances que a <- b <- c, et les mêmes que a <- b -> c, mais pas les mêmes que a -> b <- c. Ce dernier graphique dit que aet csont indépendants si bn'est pas observé, mais a <- b -> cdit aet csont dépendants dans ce cas. Nous pouvons ajouter un bord directement de aà cpour capturer cela, mais alors aet cétant indépendant quand bon l'observe n'est pas représenté. Cela signifie qu'il existe au moins une factorisation que nous ne pouvons pas exploiter lors du calcul des probabilités postérieures.

Tous ces trucs sur la dépendance / indépendance, les flèches et leurs inversions, etc., sont traités dans des textes standard sur les réseaux bayésiens. Je peux trouver quelques références si vous le souhaitez.

Les réseaux bayésiens n'expriment pas de causalité. Judea Pearl, qui a beaucoup travaillé sur les réseaux bayésiens, a également travaillé sur ce qu'il appelle les réseaux causaux (essentiellement des réseaux bayésiens annotés de relations causales).

Robert Dodier
la source
Cela répond aux questions (2) et (3). Avez-vous également une idée des questions (1) et (4)? (Oui, les références seraient bien)
Martin Thoma
(1) Considérez la contraposition: si le graphique à flèche inversée a un cycle dirigé, suivre les flèches autour du cycle en arrière doit être un cycle dirigé dans le graphique d'origine. (4) Les réseaux bayésiens sont des modèles probabilistes et en tant que tels ne représentent pas la causalité. Il est possible que certaines flèches se réfèrent à des relations causales, mais cela se perd dans un modèle probabiliste. Peut-être acause b, mais a -> bet a <- bsont également des modèles probabilistes valables.
Robert Dodier
Quelques références introductives. Koller & Friedman: "Modèles graphiques probabilistes". Cowell, Dawid, Lauritzen et Spiegelhalter: "Réseaux probabilistes et systèmes experts". Castillo, Gutierrez et Hadi: "Systèmes experts et modèles de réseaux probabilistes".
Robert Dodier
Vous pouvez inverser n'importe quelle flèche et obtenir un réseau bayésien équivalent tant que vous conservez les structures en V (ne pas inverser une flèche qu'une autre flèche pointe également vers le nœud vers lequel elle pointe)
borgr
1

Cela peut être un peu insatisfaisant, alors n'hésitez pas à accepter cette réponse, et excuses à l'avance.

Dans un réseau Bayes, les nœuds représentent des variables aléatoires et les arêtes représentent des dépendances conditionnelles. Lorsque vous interprétez les nœuds d'une certaine manière, le conditionnement se déroule naturellement d'une certaine manière. Les inverser arbitrairement n'a pas vraiment de sens dans le contexte de la modélisation des données. Et beaucoup de temps, les flèches représentent la causalité.

Taylor
la source
1
C'est assez loin de la réalité. L'interprétation "naturelle" est quelque chose qui s'impose au modèle, elle ne fait pas partie du modèle lui-même. Vous pouvez inverser les dépendances (en ajoutant des bords supplémentaires si nécessaire pour conserver l'ensemble des dépendances représentées par le réseau) et c'est toujours un réseau bayésien. Il n'est pas possible de déterminer si cela a du sens en examinant uniquement le réseau lui-même. Soit dit en passant, Judea Pearl, l'un des principaux moteurs des réseaux bayésiens dans les années 80 et 90, a récemment travaillé sur des modèles formels de causalité, qui expriment des relations causales dans le modèle.
Robert Dodier
Vous dites, "si cela a du sens n'est pas responsable en examinant uniquement le réseau lui-même." Je n'ai jamais dit que c'était le cas. J'ai dit "lorsque vous interprétez les nœuds d'une certaine manière, le conditionnement s'écoule d'une certaine manière ..." Cela reflète probablement mon parti pris; vous pouvez appeler les trucs que je travaille sur un filet bayésien, mais cette question ne se poserait jamais pour moi. Par exemple, si deux nœuds représentent la même variable à des moments différents, il n'y aurait pas de question sur la direction du flux de conditionnement. J'accepte la possibilité, cependant, qu'il existe des situations où les gens pourraient utiliser ces filets de Baye de manière moins rigide.
Taylor
0

question 3

synergy.st-andrews.ac.uk/vannesmithlab affirme que les graphiques

G1 = o->o->o and
G2 = o<-o->o

sont dans une classe d'équivalence. Selon cette source, les modèles représentent exactement la même distribution de probabilité conjointe.

Martin Thoma
la source
Ça ne peut pas être vrai. Pour G1, la première et la dernière dépendent en l'absence de valeurs connues. Pour G2, la première et la dernière ne sont pas dépendantes en l'absence de valeurs connues. Vouliez-vous G2 = o <- o -> oplutôt écrire ? Quoi qu'il en soit, je ne vois aucune réclamation concernant ces graphiques particuliers sur la page Web à laquelle vous avez fait référence; vous pouvez peut-être être plus précis.
Robert Dodier