2 Échantillon Kolmogorov-Smirnov vs Anderson-Darling vs Cramer-von-Mises

15

Je me demandais quels sont les critères pour utiliser Kolmogorov-Smirnov, Cramer-von-Mises et Anderson-Darling lors de la comparaison de 2 ECDFS. Je connais les mathématiques de la différence, mais si j'ai des données ECDF, comment saurais-je quel test est approprié à utiliser?

Socle
la source

Réponses:

9

Pour faire court: le test d'Anderson-Darling est supposé être plus puissant que le test de Kolmogorov-Smirnov.

Jetez un coup d'œil sur cet article comparant divers tests (de normalité, mais les résultats valent pour comparer deux distributions) Comparaisons de puissance de Shapiro-Wilk, Kolmogorov-Smirnov, Lilliefors et Anderson-Darling Tests par Nornadiah Mohd Razali & Yap Bee Wah.

Le test d'Anderson-Darling est beaucoup plus sensible aux queues de distribution, tandis que le test de Kolmogorov-Smirnov est plus conscient du centre de distribution.

Pour résumer, je vous recommanderais d'utiliser le test d'Anderson-Darling ou éventuellement de Cramer-von Misses, pour obtenir un test beaucoup plus puissant.

Adam Przedniczek
la source
1
Merci pour l'info. Et CVM? Quand ce test serait-il utilisé?
Plinthe
@Plinth Franchement parlant, si j'étais vous, j'utiliserais simplement AD tant que AD ne manquerait pas de répondre à vos besoins, c'est simplement parce que ma coutume. Mais je ne dis pas qu'il existe une règle générale pour préférer AD à CvM. Dans certains cas, l'effort important est fait pour comparer ces 2 tests dans des conditions spécifiques comme ici ( onlinelibrary.wiley.com/doi/10.1029/2004WR003204/full ). C'est à vous de savoir s'il vaut la peine d'investir autant de temps pour les comparer et si vous pensez que la MA pourrait être légèrement meilleure, mais ce n'est que ma prémonition. Peut-être que quelqu'un de plus expérimenté s'exprimerait.
Adam Przedniczek
18

Chacun des trois tests a un meilleur pouvoir contre différentes alternatives; mais d'un autre côté, tous les trois présentent des degrés variables de biais de test dans certaines situations.

De manière générale, le test Anderson-Darling a un meilleur pouvoir contre les queues plus grosses que spécifié et le Kolmogorov-Smirnov a plus de pouvoir contre les déviations au milieu, avec Cramer-von Mises entre les deux mais un peu plus proche du Kolmogorov-Smirnov en ce sens le respect.

Les types d'alternatives que beaucoup de gens trouvent intéressants ont tendance à être repris plus souvent par le test d'Anderson-Darling et de Cramer-von Mises, mais vos besoins particuliers peuvent être différents.

L'Anderson-Darling a tendance à souffrir de problèmes de biais globalement plus mauvais (pour les tests d'hypothèse, le biais signifie qu'il existe des alternatives que vous êtes encore moins susceptibles de rejeter que le zéro - ce qui n'est pas ce que vous attendez d'un test de qualité d'ajustement omnibus - - mais il semble difficile à éviter dans des situations réalistes).

Un certain nombre d'études de puissance ont été réalisées, notamment un éventail de tests de qualité de l'ajustement; généralement pour les alternatives qu'ils envisagent, l'Anderson-Darling a tendance à sortir le mieux le plus souvent --- mais si vous testez l'uniformité et essayez de choisir, disons, une alternative bêta (2,2), aucune ne réussit bien, et l'Anderson Darling est le pire.

Glen_b -Reinstate Monica
la source