Quel est l'intérêt des modèles graphiques?

8

J'ai passé la journée à découvrir le package bnlearn dans R pour découvrir que les modèles bayésiens ne fonctionnent pas avec les graphes non orientés. J'essaie d'en savoir plus sur le Markov Random Field Network, et jusqu'à présent, tout ce que j'ai pu faire est de créer la structure graphique à l'aide d'un LASSO graphique.

Dans les graphiques dirigés, il semble y avoir deux étapes: «l'apprentissage structurel» effectué par une méthode, puis «l'apprentissage des paramètres» effectué par une autre méthode. Mon sentiment est que l'apprentissage des paramètres vous renseigne sur les poids des bords entre chaque variable (fonction) incluse dans votre modèle. Ma question est ... alors quoi? Que faites-vous avec un graphique avec des poids de bord?

Si j'ai un ensemble de données qui est des observations par entités et que les nœuds de mon graphique sont les entités de cet ensemble de données (glanées à partir du graphique LASSO essayant d'émuler l'inverse de la matrice de covariance), que puis-je en tirer? Puis-je comparer des cohortes de mes données (séparées par la valeur de la classe cible) et affecter une sorte d'analyse de valeur p aux nœuds? Je suis confus, je pense, à propos de la grande image des modèles graphiques.

areyoujokingme
la source

Réponses:

5

La valeur et la puissance des modèles graphiques de relations probabilistes conditionnelles sont qu'ils véhiculent des informations sur la structure causale et la structure inférentielle du système. Par exemple, la pluie ou les gicleurs peuvent provoquer des trottoirs mouillés, mais les trottoirs humides ne peuvent pas provoquer de pluie ou de pulvérisation de gicleurs. Si votre preuve est «pluie» et «non gicleurs», vous pouvez en déduire certaines choses. Si votre preuve est un «trottoir mouillé», vous pouvez en déduire d'autres choses. Ce que vous pouvez et ne pouvez pas déduire est déterminé par la structure du graphique.

Votre exemple «d'un ensemble de données qui est des observations par entités» peut ou peut ne pas être bien adapté à un graphique probabiliste. Ajouter des idées / méthodes comme les «valeurs p» ne fera que vous embrouiller, je pense. (Les valeurs P s'appliquent aux tests d'hypothèses fréquentistes.) Métaphoriquement, vous combinez des pommes, des oranges et des tatous.

Je vous suggère de consulter les conférences de Judea Pearl ( https://www.youtube.com/watch?v=zHjdd--W6o4 , https://www.youtube.com/watch?v=IiXvpPyhMw8 ) ainsi que des didacticiels comme ceux-ci : https://www.youtube.com/watch?v=YvdpnqMRmfk , https://www.youtube.com/watch?v=Xhdpk9HZQuo .

MrMeritology
la source
Ah ok! J'ai donc regardé les deux, et j'ai remarqué que tous les graphiques dirigés contiennent un nœud de résultat, et cela a du sens pour moi (qu'il existe une relation dirigée entre les fonctionnalités et le résultat, et entre les fonctionnalités qui sont des combinaisons linéaires d'autres fonctionnalités, etc. ). Ma question est maintenant .. comment peut-on incorporer des nœuds cibles (résultats) dans des modèles graphiques? La méthode de covariance inverse pour l'apprentissage structurel que les RF de Markov utilisent n'inclut pas le nœud cible (classe de résultats) - uniquement les vecteurs de caractéristiques de l'ensemble d'entraînement, etc.
vousoujokingme
Les RF de Markov décrivent donc les relations entre les entités, mais pas la relation des entités avec la variable de classe de prédiction. Alors, que pouvez-vous vraiment conclure en plus, peut-être, des fonctionnalités qui ont le plus d'influence par rapport aux autres?
areyoujokingme