Je vais utiliser le test de Kolmogorov-Smirnov pour tester la normalité de MYDATA en R. Ceci est un exemple de ce que je fais
ks.test(MYDATA,"pnorm",mean(MYDATA),sd(MYDATA))
Voici le résultat que R me donne:
data: MYDATA
D = 0.13527, p-value = 0.1721
alternative hypothesis: two-sided
Warning message:
In ks.test(MYDATA, "pnorm", mean(MYDATA), sd(MYDATA)) :
ties should not be present for the Kolmogorov-Smirnov test
Je pense qu'il y a un problème, que signifie "liens" dans cet avertissement?
Réponses:
Vous avez ici deux problèmes:
Le test KS est pour une distribution continue et donc MYDATA ne doit contenir aucun lien (valeurs répétées).
La théorie sous-jacente au test KS ne vous permet pas d'estimer les paramètres de la distribution à partir des données comme vous l'avez fait. L'aide de ks.test explique cela.
la source
ks.test
dans un cas à deux échantillons, les liens doivent-ils être supprimés des deuxx
ety
? Je veux dire, je n'ai aucun lien entrex
ety
(unique(x)
etunique(y)
), mais les deux vecteurs ont une valeur en commun. Les liens ne devraient-ils pas être considérés uniquement parmi les valeurs enx
et eny
?Comme expliqué par @mdewey, le test KS ne convient pas lors de l'estimation des paramètres à partir des données. Vous pouvez utiliser le code suivant, qui repose sur le test de normalité d'Anderson-Darling, et ne vous oblige pas à fournir la moyenne et le stddev. Ce test est plus précis que le test de Lilliefors.
la source