Comprendre le message d'avertissement «Des liens sont présents» dans Kruskal-Wallis post hoc

8

J'effectue des comparaisons post-hoc après un test de Kruskal-Wallis. J'utilise le package PMCMR .

> posthoc.kruskal.nemenyi.test( preference ~ instrument)

    Pairwise comparisons using Tukey and Kramer (Nemenyi) test  
                   with Tukey-Dist approximation for independent samples 

data:  preference by instrument 

       Cello Drums Guitar
Drums  0.157 -     -     
Guitar 0.400 0.953 -     
Harp   0.013 0.783 0.458 

P value adjustment method: none 

Warning message:
In posthoc.kruskal.nemenyi.test.default(c(50L, 50L, 50L, 50L, 49L,  :
  Ties are present, p-values are not corrected.

Je suis confus par le message d'avertissement. Quelqu'un peut-il expliquer ce que cela signifie et comment je peux le corriger?

dB '
la source
1
J'ai eu le même avertissement lors de la course posthoc.kruskal.nemenyi.test(). J'ai donc ajusté les liens en exécutant des donnéesx<rank(datax, ties.method = "average") avant d'exécuter posthoc.kruskal.nemenyi.test (datax datay) encore mais j'ai toujours le même avertissement concernant "Les liens sont présents". Est-ce un problème général ou ce problème découle-t-il de mes données?
Constanze

Réponses:

5

Une égalité signifie que plusieurs observations partagent la même valeur (d'où le même rang). Par exemple, un échantillon se compose d'observations:1,3,3,5,10,10,10. "3" et "10"sont deux liens, où 3 a des répliques de 2 et 10 a des répliques de 3. Un tel échantillon correspond aux statistiques de classement:1,2,2,4,5,5,5.

Lorsque des liens sont présents, nous devons généralement les rompre (sinon, vous obtiendrez probablement le message d'avertissement comme vous l'avez montré). Et conventionnellement, nous rompons les liens dans les statistiques de classement, contrairement à rompre les liens dans les observations originales. Étant donné que le test de Kruskal-Wallis utilise des statistiques de classement, il suffit de répondre à votre question en restreignant la portée aux statistiques de classement.

Deux méthodes de bris d'égalité sont courantes, l'une consiste à "rompre les liens par hasard". À savoir, nous régénérons des rangs distincts au hasard parmi les liens. Poursuivant l'exemple ci-dessus, à égalité "2,2", nous pouvons tirer deux nombres sans remplacement de l'ensemble {2,3}, puis affectez-les aux deuxième et troisième positions, par exemple, "3, 2". De même, nous pouvons le faire pour la cravate10. Une statistique de rang ajusté possible peut être1,3,2,4,6,5,7, d'où les liens se sont rompus. L'inconvénient de cette méthode est que vous pouvez obtenir des statistiques de test différentes entre différentes analyses, car le bris d'égalité est aléatoire.

La deuxième méthode est la «moyenne». C'est-à-dire que la moyenne attribue à chaque élément lié le rang "moyen". En utilisant cette méthode, les statistiques de classement d'origine deviennent:1,2.5,2.5,4,6,6,6. Cette méthode ajuste essentiellement les liens au lieu de les briser.

Dans le logiciel, vous pouvez spécifier des options de départage pour lesquelles vous devriez consulter la documentation de la fonction.

Pour une discussion similaire sur ce problème, voir Comment fonctionne l'argument ties.method de la fonction de classement de R?

Zhanxiong
la source