La question dit tout. J'ai lu à la fois que l'on ne peut pas généraliser KS à une dimension égale ou supérieure à deux , et que les implémentations célèbres comme celle dans les recettes numériques sont tout simplement erronées. Pourriez-vous expliquer pourquoi?
kolmogorov-smirnov
bivariate
ecdf
pedrofigueira
la source
la source
Réponses:
Je pense qu'il est légitime de citer la partie pertinente du paragraphe en question:
Comme indiqué, cela semble trop fort.
1) La fonction de distribution bivariée, qui est est une carte de R 2 à [ 0 , 1 ] . Autrement dit, la fonction prenddes valeurs réellesunivariéesentre 0 et 1. Ces valeurs - étant des probabilités - sont certainement déjà "ordonnées" - et c'est là (la valeur de la fonction) que nous devons faire des comparaisons pour les tests basés sur ECDF . De même, le ECDF, FF( x1, x2) = P( X1≤ x1, X2≤ x2) R2 [ 0 , 1 ] F^ est parfaitement bien défini dans le cas bivarié.
Je ne pense pas qu'il soit nécessairement nécessaire d'essayer de le transformer en une fonction d'une variable combinée univariée comme le suggère le texte. Vous calculez simplement et F à chaque combinaison requise et de calculer la différence.F F^
2) Cependant, sur la question de savoir si c'est sans distribution, ils ont un point:
a) il est clair qu'une telle statistique de test ne serait pas altérée par des modifications des transformations des marges, c'est-à-dire si elle est construite comme un test d'uniformes indépendants bivariés, , alors elle fonctionne aussi bien que un test d'indépendant ( X 1 , X 2 ) où U i = F i ( X i ) . En ce sens, il est sans distribution (on pourrait dire «sans marge»).U =( U1, U2) ( X1, X2) Uje= Fje( Xje)
b) cependant, il y a un point sous-jacent plus généralement au sens large qu'une version naïve de la statistique KS (comme je viens de le décrire) n'est pas plus généralement libre de distribution; on ne peut pas simplement transformer arbitrairement X ∗ = g ( U ) .U X∗= g ( U )
Dans une version antérieure de ma réponse, j'ai dit:
C'est faux. Il y a effectivement des problèmes s'il y a un changement non seulement des marges des uniformes indépendants bivariés, comme je viens de le mentionner. Cependant, ces difficultés ont été examinées de plusieurs manières dans un certain nombre d'articles qui produisent des versions bivariées / multivariées des statistiques de Kolmogorov-Smirnov qui ne souffrent pas de ce problème.
Je reviendrai peut-être pour ajouter certaines de ces références et discuter de leur fonctionnement dès que le temps le permettra.
la source