Séquence de Halton vs séquence de Sobol?

À partir d'une réponse à une question précédente , j'ai été orienté vers la séquence de Halton, pour créer un ensemble de vecteurs qui couvraient un espace d'échantillonnage uniforme de manière assez uniforme. Mais la page wikipedia mentionne que les nombres premiers supérieurs en particulier sont souvent fortement corrélés au début de la série. Cela semble être le cas pour toute paire de nombres premiers élevés avec une taille d'échantillon relativement courte - et même lorsque les variables ne sont pas corrélées, l'espace d'échantillonnage n'est pas échantillonné de manière uniforme, il existe plutôt des bandes diagonales de forte densité d'échantillon à travers l'espace .

Parce que j'utilise des vecteurs de longueur 6 ou plus, je devrai inévitablement utiliser des nombres premiers pour lesquels cela pose problème (bien que pas aussi mauvais que dans l'exemple ci-dessus), et certaines paires de variables seront échantillonnées de manière non uniforme dans leur plan d'échantillonnage. L'utilisation de la séquence de Sobol pour générer un ensemble similaire me semble (juste en regardant les graphiques) générer des échantillons entre des paires de variables qui sont beaucoup plus uniformément réparties, même pour un nombre relativement faible d'échantillons. Cela semble beaucoup plus utile, et donc je me demande quand une séquence de Halton serait plus bénéfique? Ou est-ce juste que la séquence de Halton est plus facile à calculer?

Remarque: la discussion d'autres séquences multidimensionnelles à faible écart est également la bienvenue.

sampling small-sample quasi-monte-carlo rien101
la source

Réponses:

Oui, Halton est plus facile à calculer, mais il a les problèmes que vous avez mentionnés. Halton peut être amélioré par la méthode sautée de Halton, mais ce ne sera pas vraiment mieux que Sobol. Pour des dimensions élevées (comme ) et un comptage modéré (comme autour de 500), toutes les méthodes rencontreront des problèmes, par exemple certaines projections 2D dans Sobol sembleront étranges, montrant des motifs forts, pas en diagonale mais plus comme un échiquier! Une façon d'améliorer la randomisation et par exemple la soi-disant transformation de tente. $d>10$ $N$

user32038
la source

Pourriez-vous développer votre dernière phrase?

naught101