La distribution de Kolmogorov – Smirnov est connue d'après le test de Kolmogorov – Smirnov . Mais c'est aussi la distribution du supremum du pont brownien.
Comme c'est loin d'être évident (pour moi), je voudrais vous demander une explication intuitive de cette coïncidence. Les références sont également les bienvenues.
Réponses:
oùZi(x)=1Xi≤x−E[1Xi≤x]
par CLT vous avezGn=1n√∑ni=1Zi(x)→N(0,F(x)(1−F(x)))
c'est l'intuition ...
le pont brownien a la variance http://en.wikipedia.org/wiki/Brownian_bridge remplacer par . C'est pour un ...t ( 1 - t ) t F ( x ) xB ( t ) t ( 1 - t ) t F( x ) X
Vous devez également vérifier la covariance et il est donc toujours facile de montrer (CLT) que pour ( ) où est avec , . ( G n ( x 1 ) , … , G n ( x k ) ) → ( B 1 , … , B k ) ( B 1 , … , B k ) N ( 0 , Σ ) Σ = ( σ i j ) σ i j = minX1, … , Xk ( Gn( x1) , … , Gn( xk) ) → ( B1, … , Bk) ( B1, … , Bk) N( 0 , Σ ) Σ = ( σje j) σje j= min (F( xje) ,F( xj) ) -F( xje) F( xj)
La partie difficile est de montrer que la distribution du suppremum de la limite est le supremum de la distribution de la limite ... Comprendre pourquoi cela se produit nécessite une théorie des processus empiriques, en lisant des livres tels que van der Waart et Welner (pas facile) . Le nom du théorème est le théorème de Donsker http://en.wikipedia.org/wiki/Donsker%27s_theorem ...
la source
Pour Kolmogorov-Smirnov, considérons l'hypothèse nulle. Il dit qu'un échantillon est tiré d'une distribution particulière. Donc si vous construisez la fonction de distribution empirique pour échantillons , dans la limite des données infinies, il converger vers la distribution sous-jacente.f ( x ) = 1n F( x ) = 1n∑jeχ( - ∞ , Xje]( x )
Pour des informations finies, il sera désactivé. Si l'une des mesures est , alors à la fonction de distribution empirique monte d'un cran. Nous pouvons le considérer comme une marche aléatoire qui est contrainte de commencer et de se terminer sur la vraie fonction de distribution. Une fois que vous savez cela, vous allez fouiller la littérature pour la grande quantité d'informations connues sur les promenades aléatoires pour découvrir quelle est la plus grande déviation attendue d'une telle marche.q x = q
Vous pouvez faire la même astuce avec n'importe quelle normale de la différence entre les fonctions de distribution empiriques et sous-jacentes. Pour , cela s'appelle le test de Cramer-von Mises. Je ne connais pas l'ensemble de ces tests pour les arbitraires réels et positifs d' une classe complète de quelque nature que ce soit, mais cela pourrait être une chose intéressante à regarder.p p = 2 p
la source