J'essaie de comprendre comment fonctionnent les machines Boltzmann, mais je ne sais pas trop comment les poids sont appris et je n'ai pas pu trouver de description claire. Est-ce que ce qui suit est correct? (En outre, des pointeurs vers de bonnes explications de la machine Boltzmann seraient également excellents.)
Nous avons un ensemble d'unités visibles (par exemple, correspondant aux pixels noirs / blancs dans une image) et un ensemble d'unités cachées. Les poids sont initialisés d'une manière ou d'une autre (par exemple, uniformément à partir de [-0,5, 0,5]), puis nous alternons entre les deux phases suivantes jusqu'à ce qu'une règle d'arrêt soit atteinte:
Phase bloquée - Dans cette phase, toutes les valeurs des unités visibles sont fixes, nous ne mettons donc à jour que les états des unités cachées (selon la règle d'activation stochastique de Boltzmann). Nous mettons à jour jusqu'à ce que le réseau soit à l'équilibre. Une fois que nous atteignons l'équilibre, nous continuons à mettre à jour plusieurs fois (pour certains prédéfinis ), en gardant une trace de la moyenne de (où sont les états des nœuds et ). Après ces mises à jour d'équilibre, nous mettons à jour , oùest un certain taux d'apprentissage. (Ou, au lieu de faire une mise à jour par lots à la fin, mettons-nous à jour après l'étape d'équilibre?)
Phase libre - Dans cette phase, les états de toutes les unités sont mis à jour. Une fois que nous atteignons l'équilibre, nous continuons également à mettre à jour N 'plusieurs fois, mais au lieu d'ajouter des corrélations à la fin, nous soustrayons: .
Donc mes principales questions sont:
Chaque fois que nous sommes dans la phase bloquée, réinitialisons-nous les unités visibles à l'un des modèles que nous voulons apprendre (avec une fréquence qui représente l'importance de ce modèle), ou laissons-nous les unités visibles dans l'état où elles étaient à la fin de la phase libre?
Faisons-nous une mise à jour par lots des poids à la fin de chaque phase, ou mettons-nous à jour les poids à chaque étape d'équilibre de la phase? (Ou bien, est-ce une amende?)
la source