En conjonction avec une question de validation croisée sur la simulation à partir d'une copule spécifique, c'est-à-dire un cdf multivarié défini sur , j'ai commencé à m'interroger sur l'image plus grande, à savoir comment, Lorsqu'on lui donne une telle fonction, peut-on imaginer un algorithme générique pour simuler à partir de la distribution de probabilité correspondante?
De toute évidence, une solution consiste à différencier fois pour produire le pdf correspondant et ensuite appeler un algorithme MCMC générique comme Metropolis-Hastings afin de produire un échantillon de (ou ).
A part: Une autre solution est de s'en tenir aux copules d'Archimède, en utilisant la transformée de Laplace-Stieljes pour la simulation, mais ce n'est pas toujours possible en pratique. Comme je l'ai trouvé en essayant de résoudre la question susmentionnée .
Ma question consiste à éviter cette étape de différenciation de manière générique, si possible.
Réponses:
Il s'agit d'une tentative que je n'ai pas complètement étudiée, mais trop longue pour la section des commentaires. Il pourrait être utile de le mettre ici comme une autre alternative de base pour un très faible . Il ne nécessite pas de différenciation explicite + MCMC (mais il effectue une différenciation numérique, sans MCMC).k
Algorithme
Pour les petits :ε>0
Discussion
Cet algorithme devrait générer des échantillons iid à partir d'une -approximation de , où dépend simplement de la précision numérique. Il existe des détails pratiques pour affiner l'approximation et la rendre numériquement stable.ε C(u1,…,uk) ε
Le problème évident est que la complexité de calcul est échelonnée en , donc, pour le dire généreusement, ce n'est pas très général en termes de (mais l'exemple que vous avez lié avait , alors peut-être que cette méthode est pas complètement inutile - je ne connais pas le scénario typique dans lequel vous auriez accès au cdf). En revanche, pour des distributions de très faible dimension, cela pourrait fonctionner, et le coût est compensé par le fait que, contrairement à l'autre solution générique de "différenciation + MCMC", il n'y a pas besoin de calculer de dérivées, les échantillons sont iid et là est pas de réglage (à part le choix deO(2k) k k=3 ε , ce qui devrait être légèrement supérieur à la précision de la machine). Et peut-être existe-t-il des moyens de faire mieux que l'approche naïve.
Comme je l'ai mentionné, cela me vient à l'esprit et il pourrait donc y avoir d'autres problèmes.
la source