J'ai lu ici que, étant donné un échantillon d'une distribution continue avec cdf , l'échantillon correspondant à suit une distribution uniforme standard.
J'ai vérifié cela en utilisant des simulations qualitatives en Python, et j'ai facilement pu vérifier la relation.
import matplotlib.pyplot as plt
import scipy.stats
xs = scipy.stats.norm.rvs(5, 2, 10000)
fig, axes = plt.subplots(1, 2, figsize=(9, 3))
axes[0].hist(xs, bins=50)
axes[0].set_title("Samples")
axes[1].hist(
scipy.stats.norm.cdf(xs, 5, 2),
bins=50
)
axes[1].set_title("CDF(samples)")
Il en résulte le tracé suivant:
Je n'arrive pas à comprendre pourquoi cela se produit. Je suppose que cela a à voir avec la définition du CDF et sa relation avec le PDF, mais il me manque quelque chose ...
Je vous serais reconnaissant si quelqu'un pouvait m'indiquer une lecture sur le sujet ou m'aider à obtenir une certaine intuition sur le sujet.
EDIT: Le CDF ressemble à ceci:
Réponses:
Supposons que soit continue et croissante. Définissez Z = F X ( X ) et notez que Z prend des valeurs dans [ 0 , 1 ] . Alors F Z ( x ) = P ( F X ( X ) ≤ x ) = P ( X ≤ F - 1 X ( x ) ) = F X ( F -FX Z=FX(X) Z [0,1]
la source
la source