Comment faire l'ANOVA sur des données qui ne sont toujours pas normales après des transformations?

8

Je regarde l'effet que les conditions induisant la défaite et le piégeage ont sur les évaluations subjectives de la défaite et du piégeage à trois moments différents (entre autres).

Cependant, les évaluations subjectives ne sont pas normalement distribuées. J'ai fait plusieurs transformations et la transformation de la racine carrée semble fonctionner le mieux. Cependant, certains aspects des données ne sont pas encore normalisés. Cette non-normalité se manifeste par une asymétrie négative dans des conditions de défaite élevée avec piégeage élevé au moment où je m'attendais à ce qu'il y ait les taux de défaite et de piégeage les plus élevés. Par conséquent, je pense que l'on pourrait soutenir que ce biais est dû à la manipulation expérimentale.

Serait-il acceptable d'exécuter des ANOVA sur ces données malgré le manque de normalité, compte tenu des manipulations? Ou des tests non paramétriques seraient-ils plus appropriés? Si oui, existe-t-il un équivalent non paramétrique d'une ANOVA mixte 4x3?

mpiktas
la source

Réponses:

15

Ce sont les résidus qui devraient être normalement distribués, pas la distribution marginale de votre variable de réponse.

J'essaierais d'utiliser des transformations, de faire l'ANOVA et de vérifier les résidus. S'ils semblent sensiblement anormaux quelle que soit la transformation que vous utilisez, je passerais à un test non paramétrique tel que le test de Friedman.

Rob Hyndman
la source
1
+1. Il convient de noter qu'il existe des procédures formelles assez simples pour étudier les transformations, telles que les diagrammes de propagation par rapport au niveau (décrits dans l' EDA de Tukey ).
whuber
3

Je pense qu'avec des données asymétriques, vous devrez peut-être refléter les données pour qu'elles deviennent asymétriques avant d'appliquer une autre transformation de données (par exemple, log ou racine carrée). Cependant, cela a tendance à rendre l'interprétation de vos résultats difficile.

Quelle est votre taille d'échantillon? Selon leur taille exacte, les tests paramétriques peuvent donner des estimations assez bonnes.

Sinon, pour une alternative non paramétrique, vous pouvez peut-être essayer le test de Friedman .

De plus, vous pouvez essayer de réaliser une MANOVA pour des mesures répétées, avec une variable de temps explicite incluse, comme alternative à une ANOVA mixte 4x3. Une différence majeure est que l'hypothèse de sphéricité est relâchée (ou plutôt, elle est estimée pour vous) et que tous les points temporels de votre variable de résultat sont ajustés en même temps.

Iris Tsui
la source
FWIW, toute transformation Box-Cox de puissance supérieure à 1 réduira le biais négatif. À la lumière de la réponse de Rob Hyndman, ce n'est pas la première chose à essayer, cependant.
whuber
2

Une transformation boxcox (il y en a une dans le package MASS) fonctionne aussi bien sur des données négativement que positivement asymétriques. Pour info, vous devez entrer une formule dans cette fonction comme y ~ 1 et vous assurer que tout y est positif en premier (si ce n'est pas simplement ajouter une constante comme abs (min (y))). Vous devrez peut-être ajuster la plage lambda dans la fonction pour trouver le pic de la courbe. Il vous donnera la meilleure valeur lambda à choisir, puis vous appliquerez simplement cette transformation:

b <- boxcox(y~1)
lambda <- b$x[b$y == max(b$y)]
yt <- (y^lambda-1)/lambda
#you can transform back with
ytb <- (t*lambda+1)^(1/lambda)

Vérifiez si vos données sont normales.

#you can transform back with
ytb <- (t*lambda+1)^(1/lambda)
#maybe put back the min
ytb <- ytb - abs(min(y))
John
la source