Pourquoi le CDF d'un échantillon est-il uniformément distribué

17

J'ai lu ici que, étant donné un échantillon d'une distribution continue avec cdf , l'échantillon correspondant à suit une distribution uniforme standard.X1,X2,...,XnFXUi=FX(Xi)

J'ai vérifié cela en utilisant des simulations qualitatives en Python, et j'ai facilement pu vérifier la relation.

import matplotlib.pyplot as plt
import scipy.stats

xs = scipy.stats.norm.rvs(5, 2, 10000)

fig, axes = plt.subplots(1, 2, figsize=(9, 3))
axes[0].hist(xs, bins=50)
axes[0].set_title("Samples")
axes[1].hist(
    scipy.stats.norm.cdf(xs, 5, 2),
    bins=50
)
axes[1].set_title("CDF(samples)")

Il en résulte le tracé suivant:

Diagramme montrant l'échantillon d'une distribution normale et le cdf de l'échantillon.

Je n'arrive pas à comprendre pourquoi cela se produit. Je suppose que cela a à voir avec la définition du CDF et sa relation avec le PDF, mais il me manque quelque chose ...

Je vous serais reconnaissant si quelqu'un pouvait m'indiquer une lecture sur le sujet ou m'aider à obtenir une certaine intuition sur le sujet.

EDIT: Le CDF ressemble à ceci:

CDF de la distribution échantillonnée

Maxime Tremblay
la source
2
Calculez le cdf de . FX(X)
Zhanxiong
2
Vous trouverez une preuve de cette propriété (pour les VR continus) dans n'importe quel livre sur la simulation car c'est la base de la méthode de simulation cdf inverse.
Xi'an
2
Essayez également la transformation intégrale de probabilité
Zachary Blumenfeld
1
@ Xi'an Il est bon de souligner que la conclusion ne vaut que pour les variables aléatoires continues. Parfois, ce résultat est utilisé à tort pour des variables aléatoires discrètes. D'autre part, notons également que de nombreuses preuves impliquent l'étape dans laquelle suppose la stricte monotonie de F , qui est également une hypothèse trop forte. Le lien suivant fournit un résumé rigoureux sur ce sujet: people.math.ethz.ch/~embrecht/ftp/generalized_inverse.pdfP(F(X)x)=P(XF1(x))F
Zhanxiong
@Zhanxiong la seule condition nécessaire pour est qu'il soit càdlàg. F
AdamO

Réponses:

19

Supposons que soit continue et croissante. Définissez Z = F X ( X ) et notez que Z prend des valeurs dans [ 0 , 1 ] . Alors F Z ( x ) = P ( F X ( X ) x ) = P ( X F - 1 X ( x ) ) = F X ( F -FXZ=FX(X)Z[0,1]

FZ(x)=P(FX(X)x)=P(XFX1(x))=FX(FX1(x))=x.

U[0,1]

FU(x)=RfU(u)du=0xdu=x.

FZ(x)=FU(x)x[0,1]

Hunaphu
la source
S'ensuit-il que Z a une distribution uniforme (0, 1)?
StatsSorceress
Z(0,1).
8

F(x)F(x)FxF1x=F1(p)xpFF1=λF1F

Fa<bP(F1(a)<x<F1(b))=P(a<F(X)<b)=ba

AdamO
la source
Y=F(X)