J'effectue des comparaisons post-hoc après un test de Kruskal-Wallis. J'utilise le package PMCMR .
> posthoc.kruskal.nemenyi.test( preference ~ instrument)
Pairwise comparisons using Tukey and Kramer (Nemenyi) test
with Tukey-Dist approximation for independent samples
data: preference by instrument
Cello Drums Guitar
Drums 0.157 - -
Guitar 0.400 0.953 -
Harp 0.013 0.783 0.458
P value adjustment method: none
Warning message:
In posthoc.kruskal.nemenyi.test.default(c(50L, 50L, 50L, 50L, 49L, :
Ties are present, p-values are not corrected.
Je suis confus par le message d'avertissement. Quelqu'un peut-il expliquer ce que cela signifie et comment je peux le corriger?
posthoc.kruskal.nemenyi.test()
. J'ai donc ajusté les liens en exécutant des donnéesRéponses:
Une égalité signifie que plusieurs observations partagent la même valeur (d'où le même rang). Par exemple, un échantillon se compose d'observations:1,3,3,5,10,10,10 . "3 " et "10 "sont deux liens, où 3 a des répliques de 2 et 10 a des répliques de 3 . Un tel échantillon correspond aux statistiques de classement:1,2,2,4,5,5,5 .
Lorsque des liens sont présents, nous devons généralement les rompre (sinon, vous obtiendrez probablement le message d'avertissement comme vous l'avez montré). Et conventionnellement, nous rompons les liens dans les statistiques de classement, contrairement à rompre les liens dans les observations originales. Étant donné que le test de Kruskal-Wallis utilise des statistiques de classement, il suffit de répondre à votre question en restreignant la portée aux statistiques de classement.
Deux méthodes de bris d'égalité sont courantes, l'une consiste à "rompre les liens par hasard". À savoir, nous régénérons des rangs distincts au hasard parmi les liens. Poursuivant l'exemple ci-dessus, à égalité "2,2 ", nous pouvons tirer deux nombres sans remplacement de l'ensemble {2,3} , puis affectez-les aux deuxième et troisième positions, par exemple, "3, 2". De même, nous pouvons le faire pour la cravate10 . Une statistique de rang ajusté possible peut être1,3,2,4,6,5,7 , d'où les liens se sont rompus. L'inconvénient de cette méthode est que vous pouvez obtenir des statistiques de test différentes entre différentes analyses, car le bris d'égalité est aléatoire.
La deuxième méthode est la «moyenne». C'est-à-dire que la moyenne attribue à chaque élément lié le rang "moyen". En utilisant cette méthode, les statistiques de classement d'origine deviennent:1,2.5,2.5,4,6,6,6 . Cette méthode ajuste essentiellement les liens au lieu de les briser.
Dans le logiciel, vous pouvez spécifier des options de départage pour lesquelles vous devriez consulter la documentation de la fonction.
Pour une discussion similaire sur ce problème, voir Comment fonctionne l'argument ties.method de la fonction de classement de R?
la source