Tests post-hoc après Kruskal-Wallis: le test de Dunn ou Bonferroni a corrigé les tests de Mann-Whitney?

18

J'ai une variable distribuée non gaussienne et je dois vérifier s'il existe des différences significatives entre les valeurs de cette variable dans 5 groupes différents.

J'ai effectué une analyse unidirectionnelle de la variance de Kruskal-Wallis (qui s'est avérée significative) et après cela j'ai dû vérifier quels groupes étaient significativement différents. Puisque les groupes sont en quelque sorte triés (les valeurs de la variable dans le premier groupe sont supposées être inférieures aux valeurs de la variable dans le deuxième groupe qui sont supposées être inférieures aux valeurs de la variable dans le troisième groupe et ainsi le) Je n'ai effectué que 4 tests:

Group 1 vs Group 2
Group 2 vs Group 3
Group 3 vs Group 4
Group 4 vs Group 5

J'ai effectué cette analyse avec deux méthodes différentes. J'ai commencé par utiliser le test de comparaison multiple de Dunn, mais rien ne s'est avéré significatif. Par contre si j'utilise le test de Mann-Whitney et corrige le nombre de tests (4) utilisant Bonferroni, 3 tests s'avèrent significatifs.

Qu'est-ce que ça veut dire? À quels résultats dois-je faire confiance?

Rossella
la source
1
Notez que si vous vous attendez a priori à ce que les valeurs du groupe 1 soient les plus faibles et le groupe 5 les plus élevées, la comparaison du groupe 1 au groupe 5 aura la puissance la plus élevée pour détecter une différence.
amibe dit Réintégrer Monica
Sur la correction de Bonferroni, vous devez diviser la valeur de p par le nombre de groupes, pas le nombre de tests que vous avez effectués.
Caramba
1
Si votre alternative est commandée, il semblerait préférable d'utiliser un test conçu pour cette situation.
Glen_b -Reinstate Monica

Réponses:

20

Vous devriez utiliser le test de Dunn . Si l'on procède en passant d'un rejet de Kruskal-Wallis à l'exécution de tests de somme de classement par paire ordinaires (avec ou sans plusieurs ajustements de comparaison), on se heurte à deux problèmes: (1) les rangs utilisés par les tests de somme de classement par paire ne sont pas les rangs utilisés par le test de Kruskal-Wallis; et (2) le test de Dunn préserve une variance groupée pour les tests impliqués par l'hypothèse nulle de Kruskal-Wallis.

Bien sûr, comme pour tout test omnibus (par exemple ANOVA, Cochran's Q , etc.), les tests post hoc suivant le rejet d'un test de Kruskal-Wallis qui ont été ajustés pour des comparaisons multiples peuvent ne pas rejeter tous les tests par paire pour une famille donnée taux d'erreur ou taux de fausses découvertes correspondant à un donné pour le test omnibus.α


Le test de Dunn est implémenté dans Stata dans le package dunntest (dans le type Stata net describe dunntest, from(https://alexisdinno.com/stata)), et dans R dans le package dunn.test . Mise en garde: il existe quelques tests post hoc par paires moins connus pour suivre un Kruskal-Wallis rejeté, y compris Conover-Iman (comme Dunn, mais basé sur la distribution t , plutôt que sur la distribution z ) qui est implémenté pour Stata dans le package conovertest (dans le type Stata net describe conovertest, from(https://alexisdinno.com/stata)), et pour R dans le package conover.test , et les tests Dwass-Steel-Critchlow-Fligner.

Alexis
la source