Nombre requis de simulations pour l'analyse de Monte Carlo

10

Ma question porte sur le nombre requis de simulations pour la méthode d'analyse de Monte Carlo. Pour autant que je vois le nombre requis de simulations pour toute erreur de pourcentage autorisée (par exemple, 5) est E

n={100zcstd(x)Emean(x)}2,

où est l'écart-type de l'échantillonnage résultant, et est le coefficient de niveau de confiance (par exemple, pour 95%, il est de 1,96). Ainsi, de cette manière, il est possible de vérifier que la moyenne et l'écart-type résultants de simulations représentent la moyenne et l'écart-type réels avec un niveau de confiance de 95%.std(x)zcn

Dans mon cas, je lance la simulation 7500 fois et calcule les moyennes mobiles et les écarts-types pour chaque ensemble de 100 échantillonnages sur les 7500 simulations. Le nombre requis de simulation que j'obtiens est toujours inférieur à 100, mais le pourcentage d'erreur de moyenne et de std par rapport à la moyenne et std de résultats entiers n'est pas toujours inférieur à 5%. Dans la plupart des cas, le% d'erreur de la moyenne est inférieur à 5% mais l'erreur de std va jusqu'à 30%.

Quelle est la meilleure façon de déterminer le nombre de simulations requises sans connaître la moyenne et la std réelles (dans mon cas, le résultat de simulation soumis est normalement distribué)?

Merci d'avance pour votre aide.


Afin d'avoir une idée de ce à quoi peut ressembler la distribution des résultats de simulation lorsque l'itération est exécutée un nombre infini de fois: au lieu d'utiliser la moyenne et la variance obtenues après n nombres de simulations, j'ai décidé de trouver une fonction d'ajustement de la distribution résultante, mais ici, n doit remplir complètement l'erreur% autorisée. Je pense que de cette façon, je peux trouver des résultats plus corrects sur la fonction de distrubution cumulative qui est liée par exemple à 97,5%. Parce que lorsque je compare les résultats des simulations 400 et 7000, les fonctions d'ajustement de la distribution pour les deux échantillonnages se ressemblent, seule la courbe de la 2e est plus lisse. De plus, donc le modèle dans MATLAB / Simulink est non linéaire, bien que les paramètres d'entrée générés soient distribués normalement, l'histogramme résultant des simulations n'est pas normal pour cette raison, j'ai utilisé la "distribution généralisée des valeurs extrêmes", qui est nommé 'gev' dans MATLAB. Mais encore, je ne suis pas sûr de cette méthode, merci pour toute commande à l'avance

maxwell
la source
pour autant que je vois lorsque les résultats de la simulation sont évalués par n'importe quel critère de réussite, il est possible de trouver le nombre requis de simulation pour n'importe quel niveau de confiance, mais dans mon cas, je veux trouver la moyenne et la variance du résultat entier avec une confiance spécifique niveau avec un nombre fini d'itérations. Par conséquent, pour tous les n échantillons, la variance est utilisée pour définir l'intervalle de la moyenne, mais en fait, j'ai également besoin de la variance pour trouver toute valeur pouvant représenter CPDF de 0,975. merci pour tout commentaire
maxwell

Réponses:

4

Je mène habituellement l'étude de convergence et détermine le nombre de simulations nécessaires, puis j'utilise ce nombre dans les simulations suivantes. Je lance également un avertissement si l'erreur est supérieure à celle suggérée par le numéro choisi.

La manière typique de déterminer le nombre requis de simulations est de calculer la variance de la simulation pour N chemins, puis l'erreur standard est , voir section sur l'estimation des erreurs de MC dans "Monte Carlo Methods in Finance" de Peter Jackel , également un chapitre "Evaluating a definite integrale" dans le petit livre de Sobolσ^N2σ^NN

Alternativement, vous pouvez calculer l'erreur pour chaque simulation et arrêter lorsqu'elle dépasse un certain seuil ou que le nombre maximal de chemins est atteint, ce nombre étant à nouveau déterminé par l'étude de convergence.

Aksakal
la source