J'ai près d'un million d'ensembles de données et chaque fois que je lance un test de comparaison moyenne, soit ANOVA ou un test t, j'obtiens un niveau de signification inférieur à 0,0001 sur SPSS. Je crains que mon échantillon soit si grand que, bien sûr, lorsque je compare les moyens, il apparaîtra comme étant sensiblement différent. Un échantillon peut-il être trop grand pour l'ANOVA ou un test t?
anova
t-test
effect-size
large-data
user24232
la source
la source
Réponses:
Non, un échantillon ne peut pas être trop grand pour une ANOVA ou un test t. Vous obtiendrez presque toujours des résultats statistiquement significatifs parce que vous avez beaucoup de pouvoir; toutefois, cela ne signifie pas que vous détectez des différences fausses. En effet, quel que soit le nombre de cas dont vous disposez, un effet qui n'existe pas ne deviendra pas significatif. Il s'agit d'une idée fausse courante.
Cependant, beaucoup de puissance signifie que vous pouvez détecter des différences qui n'ont presque aucun sens en termes de taille. Par exemple, vous trouvez peut-être que deux races ont en moyenne des hauteurs différentes, mais la différence n'est que d'un demi-millimètre.
Assurez-vous d'interpréter la taille de l'effet associée à votre test statistique. Dans ce cas, la valeur p vaut moins que la taille de l'effet (comme c'est souvent le cas)!
la source
Nous vous suggérons de regarder ce qui suit (tous très lisibles et non techniques).
1. Anderson DR, Burnham KP, Thompson WL (2000) Test d'hypothèse nulle: problèmes, prévalence et alternative. Journal of Wildlife Management 64: 912-923. 2. Gigerenzer G (2004) Statistiques stupides. Journal of Socio-Economics 33: 587-606. 3. Johnson DH (1999) L'insignifiance des tests de signification statistique. The Journal of Wildlife Management 63: 763-772.
la source