Avantage de multiples simulations à Monte-Carlo à l'ancienne?

8

L'esprit de cette question vient de "l'Ordinaire de Monte-Carlo", aussi appelé "bon vieux Monte-Carlo"

Supposons que j'ai une variable aléatoire X, avec

μ:=E[X]σ2:=Var[X]

Les deux sont des valeurs inconnues, car la fonction de distribution de probabilité de X est inconnu (ou les calculs sont intraitables).

Quoi qu'il en soit, supposons que nous pouvons simuler en quelque sorte n dessine X1,X2,,Xn (ceux-ci sont indépendants et identiques) de la distribution des X. Définissons les exemples de paramètres

μ^n:=1ni=1nXiσ^n2:=1ni=1n(Xiμ^n)2

Selon le théorème central limite, comme n devient très grand, la moyenne de l'échantillon μ^n obéira de près à une distribution normale

μ^N(μ,σ2n)

Avant de pouvoir calculer les intervalles de confiance, l'auteur déclare que, comme nous ne savons pas σ2, nous ferons l'estimation que σ2σ^2, ou plus précisément pour une estimation non biaisée σ2nn1σ^2, et nous pouvons procéder à partir de là en utilisant des techniques standard.

Maintenant, alors que l'auteur mentionne l'importance de nsuffisamment grand ( nombre de tirages par simulation), il n'y a aucune mention du nombre de simulations et de son effet sur notre confiance.

Y a-t-il un avantage à courir k simulations (exécution n tire à chaque fois) pour obtenir plusieurs moyennes d'échantillonnage μ^n,1,μ^n,2,μ^n,k, puis utiliser les moyens des moyens pour améliorer nos estimations et notre confiance à l'égard de l'inconnu μ,σ de X?

Ou suffit-il de simplement dessiner n des échantillons de X dans une seule simulation, tant que n est suffisamment grand?

jII
la source

Réponses:

5

Tant que les problèmes concernant la génération de nombres pseudo-aléatoires sont évités (voir note à la fin), les deux approches (k simulations avec n tirages vs simulation unique avec suffisamment grand n) sont équivalents en ce qui concerne l'estimation de la moyenne . Concernant la mémoire, notez que, dans lek cas de simulations, vous devez stocker les moyens d'échantillonnage μ^n,1,,μ^n,kavant d'effectuer la moyenne finale, alors que cela ne se produit pas dans le scénario de simulation unique. Avec des ordinateurs modernes, effectuer une seule simulation avec suffisammentn ne devrait pas être plus difficile que ce qui a été décrit précédemment et, en fait, devrait faire gagner du temps.

La raison mathématique au-delà de l'équivalence est la linéarité. Pour être plus précis, dans lek scénario de simulation, vous calculez la moyenne de l'échantillon "final" μ^ comme suit

μ^=1kh=1kμ^n,h=1kh=1k1ni=1nXi(h)=1nkh=1ki=1nXi(h)
Xi(h) désigne le tirage numéroté i à simulation h. Cette ordination est arbitraire si rien d'étrange ne se produit, vous pouvez donc ré-étiqueter chaqueXi(h) avec un nouvel indice, disons m=1,,nk, obtention
μ^=1nkm=1nkXm
Mais cela équivaut à effectuer une seule simulation avec nk tirages (évidemment, les tirages doivent être iid, comme déjà remarqué).

Remarque: Les problèmes potentiels avec les PRNG sont décrits dans la page Wikipedia .

PseudoRandom
la source
1
Très bonne réponse! J'avais fait cette réalisation un peu après avoir posté. Et puisque la variance de notre échantillonnage est inversement proportionnelle àn(le nombre d'échantillons), notre confiance est également améliorée (au moins, théoriquement).
2014