L'échantillonnage à partir d'une distribution normale repliée est-il équivalent à l'échantillonnage à partir d'une distribution normale tronqué à 0?

9

Je souhaite simuler à partir d'une densité normale (disons moyenne = 1, sd = 1) mais ne souhaite que des valeurs positives.

Une façon consiste à simuler à partir d'une normale et à prendre la valeur absolue. Je pense à cela comme une normale pliée.

Je vois dans R il y a des fonctions pour la génération de variables aléatoires tronquées. Si je simule à partir d'une normale tronquée (troncature à 0), cela équivaut-il à l'approche repliée?

Glen
la source

Réponses:

10

Oui, les approches donnent les mêmes résultats pour une distribution normale à moyenne nulle .

Il suffit de vérifier que les probabilités s'accordent sur les intervalles, car ceux-ci génèrent l'algèbre sigma de tous les ensembles mesurables (Lebesgue). Soit la densité normale standard: donne la probabilité qu'une variable normale standard se situe dans l'intervalle . Ensuite, pour , la probabilité tronquée estΦΦ((a,b])(a,b]0ab

Φtruncated((a,b])=Φ((a,b])/Φ([0,])=2Φ((a,b])

(car ) et la probabilité repliée estΦ([0,])=1/2

Φfolded((a,b])=Φ((a,b])+Φ([b,a))=2Φ((a,b])

en raison de la symétrie de environ .Φ0

Cette analyse est valable pour toute distribution qui est symétrique par rapport à et a une probabilité nulle d'être . Cependant, si la moyenne n'est pas nulle , la distribution n'est pas symétrique et les deux approches ne donnent pas le même résultat, comme le montrent les mêmes calculs.00

Trois distributions

Ce graphique montre les fonctions de densité de probabilité pour une distribution normale (1,1) (jaune), une distribution pliée normale (1,1) (rouge) et une distribution normale tronquée (1,1) (bleu). Notez que la distribution pliée ne partage pas la forme caractéristique de la courbe en cloche avec les deux autres. La courbe bleue (distribution tronquée) est la partie positive de la courbe jaune, agrandie pour avoir une aire unitaire, tandis que la courbe rouge (distribution repliée) est la somme de la partie positive de la courbe jaune et de sa queue négative (comme reflété autour de l'axe des y).

whuber
la source
1
J'aime bien la photo.
Karl
5

Soit . La distribution de n'est certainement pas la même que celle de.X | X > 0 | X |XN(μ=1,SD=1)X|X>0|X|

Un test rapide en R:

x <- rnorm(10000, 1, 1)
par(mfrow=c(2,1))
hist(abs(x), breaks=100)
hist(x[x > 0], breaks=100)

Cela donne ce qui suit. histogrammes de simulation

Karl
la source