Dans leur manuel, Modèles graphiques, familles exponentielles et inférence variationnelle , M. Jordan et M. Wainwright discutent du lien entre les familles exponentielles et les champs aléatoires de Markov (modèles graphiques non dirigés).
J'essaie de mieux comprendre la relation entre eux avec les questions suivantes:
- Tous les MRF sont-ils membres des familles exponentielles?
- Tous les membres des familles exponentielles peuvent-ils être représentés en tant que MRF?
- Si MRFs Familles exponentielles, quels sont de bons exemples de distributions d'un type non incluses dans l'autre ?
D'après ce que je comprends dans leur manuel (chapitre 3), Jordan et Wainwright présentent l'argument suivant:
Supposons que nous ayons une variable aléatoire scalaire X qui suit une certaine distribution , et tirons observations , et nous voulons identifier .n X 1 , … X n p
Nous calculons les attentes empiriques de certaines fonctions
pour toutα∈I
où chaque dans un ensemble I indexe une fonction ϕ α : X → R
Alors si nous forçons les deux ensembles de quantités suivants à être cohérents, c'est-à-dire à correspondre (pour identifier ):
Les attentes des statistiques suffisantes ϕ de la distribution p
Les attentes sous la distribution empirique
nous obtenons un problème sous-déterminé , en ce sens qu'il existe de nombreuses distributions qui sont cohérentes avec les observations. Il nous faut donc un principe pour choisir parmi eux (identifier p ).
Si nous utilisons le principe de l'entropie maximale pour supprimer cette indétermination, nous pouvons obtenir un seul :
sous réserve de E p [ ( & phiv alpha ( X ) ] = um alpha pourensemble alpha ∈ I
où ce prend la forme p θ ( x ) ∝ exp ∑ α ∈ I θ α ϕ α ( x ) , où θ ∈ R d représente une paramétrisation de la distribution sous forme de famille exponentielle.
En d'autres termes, si nous
- Faire en sorte que les attentes des distributions soient cohérentes avec les attentes de la distribution empirique
- Utilisez le principe de l'entropie maximale pour vous débarrasser de l'indétermination
On se retrouve avec une distribution de la famille exponentielle.
Cependant, cela ressemble plus à un argument pour introduire des familles exponentielles, et (pour autant que je puisse comprendre), il ne décrit pas la relation entre les MRF et exp. des familles. Suis-je en train de manquer quelque chose?
la source
Réponses:
Vous avez tout à fait raison - l'argument que vous avez présenté relie la famille exponentielle au principe de l'entropie maximale, mais n'a rien à voir avec les MRF.
Pour répondre à vos trois questions initiales:
Les distributions mixtes sont des exemples courants de distributions familiales non exponentielles. Considérons le modèle d'espace d'état gaussien linéaire (comme un modèle de Markov caché, mais avec des états cachés continus et des distributions de transition et d'émission gaussiennes). Si vous remplacez le noyau de transition par un mélange de Gaussiens, la distribution résultante n'est plus dans la famille exponentielle (mais elle conserve toujours la riche structure d'indépendance conditionnelle caractéristique des modèles graphiques pratiques).
[1] http://en.wikipedia.org/wiki/Markov_random_field
la source