Le bootstrap peut-il être utilisé pour remplacer des tests non paramétriques?

15

Je suis relativement nouveau dans les statistiques. Le concept de bootstrapping m'a dérouté.

Je sais que la normalité de la distribution d'échantillonnage est requise pour utiliser certains tests tels que le test t. Dans les cas où les données ne sont pas normalement distribuées, en demandant le "bootstrapping" dans les tests t dans SPSS, cela contournerait-il le problème de la non-normalité? Dans l'affirmative, la statistique t indiquée dans la sortie est-elle basée sur la distribution d'échantillonnage bootstrap?

En outre, serait-ce un meilleur test par rapport à l'utilisation de tests non paramétriques comme Mann-Whitney ou Kruskal-Wallis dans les cas où j'ai des données non normales? Dans les situations où les données ne sont pas normales et que j'utilise le bootstrap, je ne signalerais pas la statistique t: non?

JC22
la source

Réponses:

16

Le bootstrap fonctionne sans avoir besoin d'hypothèses comme la normalité, mais il peut être très variable lorsque la taille de l'échantillon est petite et que la population n'est pas normale. Donc, cela peut être mieux dans le sens des hypothèses retenues, mais ce n'est pas mieux à tous égards.

Les échantillons bootstrap avec remplacement, l'échantillon de tests de permutation sans remplacement. Le test de Mann-Whitney et d'autres tests non paramétriques sont en fait des cas particuliers du test de permutation. Je préfère en fait le test de permutation ici parce que vous pouvez spécifier une statistique de test significative.

La décision sur le test à utiliser doit être basée sur la question à laquelle on répond et sur les connaissances scientifiques conduisant aux données. Le théorème de la limite centrale nous dit que nous pouvons toujours obtenir de très bonnes approximations à partir des tests t même lorsque la population n'est pas normale. La qualité des approximations dépend de la forme de la répartition de la population (et non de l'échantillon) et de la taille de l'échantillon. Il existe de nombreux cas où un test t est encore raisonnable pour des échantillons plus petits (et certains cas où il n'est pas assez bon dans de très grands échantillons).

Greg Snow
la source
Merci, c'est utile. Donc, si j'utilise le bootstrap, je ne signalerai que la valeur de p et le CI sans aucune statistique de test, est-ce correct?
JC22
(+1) Auriez-vous par hasard une référence ou un lien concernant Mann-Whitney et les tests de permutation? C'est très intéressant mais pas évident pour moi!
Gala
4
@ JC22 Vous devez signaler une statistique de test (quelle que soit statistique vous bootstrap); un test bootstrap basé sur une moyenne sera différent de celui basé sur une moyenne ajustée, par exemple.
Glen_b -Reinstate Monica
2
@ GaëlLaurans Pour un exemple de génération de la distribution exacte (permutation) de la statistique de test de somme de rang de Wilcoxon (équivalente à Mann-Whitney) et de la statistique de test de Kruskal-Wallis, voir cette réponse .
caracal
2
@ GaëlLaurans, en référence: Différents résultats du test de Wilcoxon — Mann — Whitney à partir de différents packages statistiques Reinhard Bergmann, John Ludbrook & Will PJM Spooren Journal: The American StatisticianVolume 54, numéro 1, février 2000, pages 72-77
Greg Snow