J'ai des données pour deux groupes (c'est-à-dire des échantillons) que je souhaite comparer mais la taille totale de l'échantillon est petite (n = 29) et fortement déséquilibrée (n = 22 vs n = 7).
Ces données sont logistiquement difficiles et coûteuses à collecter, donc bien que «collecter plus de données» comme solution évidente ne soit pas utile dans ce cas.
Un certain nombre de variables différentes ont été mesurées (date de départ, date d'arrivée, durée de la migration, etc.), il y a donc plusieurs tests, dont certains les variances sont très différentes (le plus petit échantillon ayant une variance plus élevée).
Au départ, un collègue a effectué des tests t sur ces données, et certains étaient statistiquement significatifs avec P <0,001, un autre n'était pas significatif avec P = 0,069. Certains échantillons étaient normalement distribués, d'autres non. Certains tests ont impliqué des écarts importants par rapport aux variances «égales».
J'ai plusieurs questions:
- les tests t sont-ils appropriés ici? Sinon, pourquoi? Cela s'applique-t-il uniquement aux tests où les hypothèses de normalité et d'égalité des variances sont satisfaites?
- quelle (s) alternative (s) appropriée (s)? Peut-être un test de permutation?
- la variance inégale gonfle l'erreur de type I, mais comment? et quel effet la petite taille d'échantillon déséquilibrée a-t-elle sur l'erreur de type I?
la source
Premièrement, comme Scortchi l'a déjà souligné, le test T ne convient pas si bien à vos données, en raison de ses hypothèses sur la distribution des données.
Pour votre deuxième point, je proposerais une alternative au test T. Si votre intérêt ne porte que sur le fait, si les distributions de vos deux échantillons sont égales ou non, vous pouvez également essayer d'utiliser la version bilatérale du test de somme de rang de Wilcoxon. Le test de somme de rang de Wilcoxon est un test non paramétrique. Ce type de test est particulièrement utile si vous n'êtes pas sûr de la distribution sous-jacente de vos données.
Il existe une solution exacte du test pour les petits échantillons ainsi que pour les grandes cohortes. De plus, il existe également un package R qui réalise le test de somme de rang de Wilcoxon.
Puisqu'il s'agit d'un test sans paramètre et qu'il gère également de petites tailles d'échantillon, le test devrait convenir à votre cas de test.
la source