Lorsque les gens mettent en œuvre des tests de permutation pour comparer un échantillon unique à une moyenne (par exemple, comme vous pourriez le faire avec un test t de permutation), comment la moyenne est-elle gérée? J'ai vu des implémentations qui prennent une moyenne et un échantillon pour un test de permutation, mais on ne sait pas ce qu'elles font réellement sous le capot. Existe-t-il même un moyen significatif de faire un test de permutation (par exemple, un test t) pour un échantillon par rapport à une moyenne supposée? Ou bien, sont-ils simplement en train de passer par défaut à un test de non-permutation sous le capot? (par exemple, malgré l'appel d'une fonction de permutation ou la définition d'un indicateur de test de permutation, la valeur par défaut est un test t standard ou une fonction similaire)
Dans un test de permutation standard à deux échantillons, on aurait deux groupes et randomiserait l'attribution des étiquettes. Cependant, comment cela est-il géré lorsqu'un "groupe" est une moyenne supposée? De toute évidence, une moyenne supposée n'a pas de taille d'échantillon en soi. Alors, quelle est la façon typique de travailler la moyenne dans un format de permutation? L'échantillon «moyen» est-il supposé être un seul point? Un échantillon de taille égale au groupe d'échantillons? Un échantillon de taille infinie?
Étant donné qu'une moyenne supposée est, eh bien, supposée - je dirais qu'elle a techniquement un support infini ou tout support que vous voulez supposer pour cela. Cependant, aucun de ces éléments n'est très utile pour un calcul réel. Un échantillon de taille égale avec des valeurs toutes égales à la moyenne semble être ce qui se fait parfois avec certains tests (par exemple, vous remplissez simplement l'autre moitié des paires avec l'emplacement supposé). Cela a un peu de sens, car c'est l'échantillon de longueur égale que vous verriez si votre moyenne supposée était correcte sans variance.
Ma question est donc la suivante: dans la pratique, les gens émulent-ils réellement la randomisation des étiquettes de style de test de permutation lorsque le deuxième ensemble est une moyenne (ou une valeur supposée abstraite similaire)? Si oui, comment les gens gèrent-ils la randomisation des étiquettes lorsqu'ils le font?
la source
Réponses:
Extension du commentaire de Glen_b en réponse
Un test de permutation approximatif à un échantillon pour la moyenne d'un échantillon, contre une hypothèse nulle de moyenne nulle, est mis en œuvre en attribuant des signes aléatoires aux données de l'échantillon. Les hypothèses nulles non nulles peuvent être testées en soustrayant la moyenne nulle souhaitée des données.
Ceci est facile à voir dans la source de la fonction R
onetPermutation
dans le packageDAAG
. Voici un extrait du code pertinent, avec des commentaires que j'ai ajoutés:la source