L'échantillonnage basé sur la chaîne de Markov est-il le «meilleur» pour l'échantillonnage de Monte Carlo? Existe-t-il des régimes alternatifs?

9

Markov Chain Monte Carlo est une méthode basée sur les chaînes de Markov qui nous permet d'obtenir des échantillons (dans un cadre Monte Carlo) à partir de distributions non standard à partir desquelles nous ne pouvons pas prélever directement des échantillons.

Ma question est de savoir pourquoi la chaîne de Markov est "à la pointe de la technologie" pour l'échantillonnage de Monte Carlo. Une autre question pourrait être, existe-t-il d'autres façons, comme les chaînes de Markov, qui peuvent être utilisées pour l'échantillonnage de Monte Carlo? Je sais (du moins en regardant la littérature) que le MCMC a des racines théoriques profondes (en termes de conditions comme (a) la périodicité, l'homogénéité et l'équilibre détaillé) mais je me demande s'il existe des modèles / méthodes probabilistes "comparables" pour Monte Échantillonnage de Carlo similaire aux chaînes de Markov.

Veuillez me guider si j'ai confondu une partie de la question (ou si cela semble déroutant).

Ikram Ullah
la source

Réponses:

11

Il n'y a aucune raison de dire que l'échantillonnage MCMC est la "meilleure" méthode Monte Carlo! Habituellement, il est au contraire pire que l'échantillonnage iid, au moins en termes de variance des estimateurs Monte Carlo résultants En effet, alors que cette moyenne converge vers l'attente lorsque est la distribution stationnaire et limitante de la chaîne de Markov , il y a au moins deux inconvénients à utiliser les méthodes MCMC:

1Tt=1Th(Xt)
Eπ[h(X)]π(Xt)t
  1. La chaîne doit "atteindre la stationnarité", ce qui signifie qu'elle doit oublier sa valeur de départ . En d'autres termes, doit être "suffisamment grand" pour que soit distribué à partir de . Parfois, "assez grand" peut dépasser de plusieurs ordres de grandeur le budget de calcul pour l'expérience.X0tXtπ
  2. Les valeurs sont corrélées, conduisant à une variance asymptotique impliquant qui dépasse généralement et nécessite donc des simulations plus longues que pour un échantillon iid.Xt
    varπ(X)+2t=1covπ(X0,Xt)
    varπ(X)

Cela étant dit, MCMC est très utile pour gérer les paramètres où l'échantillonnage iid régulier est impossible ou trop coûteux et où l'échantillonnage d'importance est assez difficile à calibrer, en particulier en raison de la dimension de la variable aléatoire à simuler.

Cependant, les méthodes Monte Carlo séquentielles comme les filtres à particules peuvent être plus appropriées dans les modèles dynamiques, où les données proviennent de salves qui nécessitent une attention immédiate et peuvent même disparaître (c'est-à-dire ne peuvent pas être stockées) après un court instant.

En conclusion, MCMC est un outil très utile (et très utilisé) pour gérer les paramètres complexes où les solutions Monte Carlo échouent.

Xi'an
la source
8

Il existe plusieurs façons de générer des valeurs aléatoires à partir d'une distribution, McMC en fait partie, mais plusieurs autres seraient également considérées comme des méthodes de Monte Carlo (sans la partie chaîne de Markov).

Le plus direct pour l'échantillonnage univarié est de générer une variable aléatoire uniforme, puis de la brancher sur la fonction CDF inverse. Cela fonctionne très bien si vous avez le CDF inverse, mais est gênant lorsque le CDF et / ou son inverse sont difficiles à calculer directement.

Pour les problèmes multivariés, vous pouvez générer des données à partir d'une copule, puis utiliser la méthode CDF inverse sur les valeurs générées pour avoir un certain niveau de corrélation entre les variables (bien que la spécification des paramètres corrects à la copule pour obtenir le niveau de corrélation souhaité nécessite souvent un peu de essai et erreur).

L'échantillonnage par rejet est une autre approche qui peut être utilisée pour générer des données à partir d'une distribution (univariée ou multivariée) où vous n'avez pas besoin de connaître le CDF ou son inverse (et vous n'avez même pas besoin de la constante de normalisation pour la fonction de densité), mais cela peut être très inefficace dans certains cas en prenant beaucoup de temps.

Si vous êtes intéressé par les résumés des données générées plutôt que par les points aléatoires vous-même, alors l'échantillonnage d'importance est une autre option.

L'échantillonnage de Gibbs, qui est une forme d'échantillonnage McMC, vous permet d'échantillonner lorsque vous ne connaissez pas la forme exacte de la distribution multivariée tant que vous connaissez la distribution conditionnelle pour chaque variable compte tenu des autres.

Il y en a d'autres aussi, ce qui dépend le mieux de ce que vous savez et ne savez pas et d'autres détails du problème spécifique. McMC est populaire car il fonctionne bien dans de nombreuses situations et se généralise à de nombreux cas différents.

Greg Snow
la source