J'ai un tas de données provenant de deux échantillons (témoins et traités), contenant chacun plusieurs milliers de valeurs qui doivent subir des tests de signification dans R. Théoriquement, les valeurs devraient être continues, mais en raison de l'arrondissement effectué par le logiciel de mesure, elles ne sont pas '' t et ils ont des liens. Les distributions sont inconnues et les formes des distributions de contrôle et traitées peuvent être différentes, donc j'aimerais utiliser un test non paramétrique pour comparer si la différence entre les échantillons est significative pour 10 facteurs différents.
J'ai pensé utiliser le test de Kolmogorov-Smirnov, mais ce n'est pas vraiment adapté aux cravates. J'ai récemment découvert une nouvelle bibliothèque R appelée Matching qui exécute une version bootstrap du test KS et tolère les liens. Est-ce vraiment une bonne idée ou dois-je utiliser un autre test à la place? Et dois-je ajuster la valeur de p?
Réponses:
Au lieu d'utiliser le test KS, vous pouvez simplement utiliser une procédure de permutation ou de rééchantillonnage telle qu'implémentée dans la
oneway_test
fonction ducoin
package. Jetez un œil à la réponse acceptée à cette question .Mise à jour : Mon package
afex
contient la fonctioncompare.2.vectors
implémentant une permutation et d'autres tests pour deux vecteurs. Vous pouvez l'obtenir auprès de CRAN:Pour deux vecteurs
x
ety
cela (actuellement) renvoie quelque chose comme:Tous les commentaires concernant cette fonction sont les bienvenus.
la source