À partir d'une réponse à une question précédente , j'ai été orienté vers la séquence de Halton, pour créer un ensemble de vecteurs qui couvraient un espace d'échantillonnage uniforme de manière assez uniforme. Mais la page wikipedia mentionne que les nombres premiers supérieurs en particulier sont souvent fortement corrélés au début de la série. Cela semble être le cas pour toute paire de nombres premiers élevés avec une taille d'échantillon relativement courte - et même lorsque les variables ne sont pas corrélées, l'espace d'échantillonnage n'est pas échantillonné de manière uniforme, il existe plutôt des bandes diagonales de forte densité d'échantillon à travers l'espace .
Parce que j'utilise des vecteurs de longueur 6 ou plus, je devrai inévitablement utiliser des nombres premiers pour lesquels cela pose problème (bien que pas aussi mauvais que dans l'exemple ci-dessus), et certaines paires de variables seront échantillonnées de manière non uniforme dans leur plan d'échantillonnage. L'utilisation de la séquence de Sobol pour générer un ensemble similaire me semble (juste en regardant les graphiques) générer des échantillons entre des paires de variables qui sont beaucoup plus uniformément réparties, même pour un nombre relativement faible d'échantillons. Cela semble beaucoup plus utile, et donc je me demande quand une séquence de Halton serait plus bénéfique? Ou est-ce juste que la séquence de Halton est plus facile à calculer?
Remarque: la discussion d'autres séquences multidimensionnelles à faible écart est également la bienvenue.