Quel est l'équivalent pour cdfs de MCMC pour pdfs?

8

En conjonction avec une question de validation croisée sur la simulation à partir d'une copule spécifique, c'est-à-dire un cdf multivarié défini sur , j'ai commencé à m'interroger sur l'image plus grande, à savoir comment, Lorsqu'on lui donne une telle fonction, peut-on imaginer un algorithme générique pour simuler à partir de la distribution de probabilité correspondante?C(u1,,uk)[0,1]k

De toute évidence, une solution consiste à différencier fois pour produire le pdf correspondant et ensuite appeler un algorithme MCMC générique comme Metropolis-Hastings afin de produire un échantillon de (ou ).C kκ(u1,,uk)Cκ

A part: Une autre solution est de s'en tenir aux copules d'Archimède, en utilisant la transformée de Laplace-Stieljes pour la simulation, mais ce n'est pas toujours possible en pratique. Comme je l'ai trouvé en essayant de résoudre la question susmentionnée .

Ma question consiste à éviter cette étape de différenciation de manière générique, si possible.

Xi'an
la source
1
Le lien "la transformation de Laplace-Stieljes" semble être rompu maintenant.
jochen

Réponses:

4

Il s'agit d'une tentative que je n'ai pas complètement étudiée, mais trop longue pour la section des commentaires. Il pourrait être utile de le mettre ici comme une autre alternative de base pour un très faible . Il ne nécessite pas de différenciation explicite + MCMC (mais il effectue une différenciation numérique, sans MCMC).k

Algorithme

Pour les petits :ε>0

  1. Dessinez . Cela peut être facilement fait en dessinant et en calculant (ce qui, le cas échéant, peut être facilement fait numériquement). Ceci est un tirage du pdf marginal .u1C1C(U1=u1,U2=1,,Uk=1)ηUniform[0,1]C11(η)u1κ(u1)
  2. Pourj=2k
    • Définissez qui peut être calculé comme une différence de évalués en divers points (qui nécessitent évaluations de pour chaque évaluation de ). est le conditionnel marginal approximatif de étant donné .
      Dj(ε)(uj|u1,,uj1)Pr(u1ε2U1u1+ε2uj1ε2Uj1uj1+ε2UjujUj+11Uk1),
      CO(2j1)CDj(ε)Dj(ε)εuju1,,uj1
    • Dessinez selon le point 1, ce qui devrait encore être facile à faire avec l'inversion numérique.ujDj(ε)(uj|u1,,uj1)

Discussion

Cet algorithme devrait générer des échantillons iid à partir d'une -approximation de , où dépend simplement de la précision numérique. Il existe des détails pratiques pour affiner l'approximation et la rendre numériquement stable.εC(u1,,uk)ε

Le problème évident est que la complexité de calcul est échelonnée en , donc, pour le dire généreusement, ce n'est pas très général en termes de (mais l'exemple que vous avez lié avait , alors peut-être que cette méthode est pas complètement inutile - je ne connais pas le scénario typique dans lequel vous auriez accès au cdf). En revanche, pour des distributions de très faible dimension, cela pourrait fonctionner, et le coût est compensé par le fait que, contrairement à l'autre solution générique de "différenciation + MCMC", il n'y a pas besoin de calculer de dérivées, les échantillons sont iid et là est pas de réglage (à part le choix deO(2k)kk=3ε, ce qui devrait être légèrement supérieur à la précision de la machine). Et peut-être existe-t-il des moyens de faire mieux que l'approche naïve.

Comme je l'ai mentionné, cela me vient à l'esprit et il pourrait donc y avoir d'autres problèmes.

lacerbi
la source