quelles sont les hypothèses du test de permutation?

On dit souvent que les tests de permutation n'ont pas d'hypothèses, mais ce n'est certainement pas vrai. Par exemple, si mes échantillons sont en quelque sorte corrélés, je peux imaginer que permuter leurs étiquettes ne serait pas la bonne chose à faire. Je pense seulement que j'ai trouvé ce problème est cette phrase de wikipedia: "Une hypothèse importante derrière un test de permutation est que les observations sont échangeables sous l'hypothèse nulle." Ce que je ne comprends pas.

Quelles sont les hypothèses des tests de permutation? Et comment ces hypothèses sont-elles liées à différents schémas de permutation possibles?

hypothesis-testing permutation-test resampling rep_ho
la source

(+1) La citation de Wikipédia, bien que correcte, est assez drôle, car lorsque vous traversez le jargon technique (obscur), cela revient à dire que vous devez permuter exactement les observations que vous supposez pouvoir permuter.

whuber

Difficile de répondre car il y a tellement de tests de permutation différents. Par exemple, pour une comparaison à k échantillons, l'hétéroscédasticité entre les groupes violerait l'hypothèse d'échangeabilité.

Michael M

(+1) Basé sur Rubin (2015) "Causal Inference for Statistics", lorsque l'étiquette (ou le traitement) est indépendante des résultats potentiels, vous pouvez utiliser le test de permutation. La logique est pour chaque sujet, il a deux résultats potentiels sous les étiquettes A et B, ils sont fixes. La procédure d'attribution d'étiquette est aléatoire et si elle est indépendante du résultat potentiel, vous pouvez alors penser à effectuer cette procédure d'attribution d'étiquette N fois, N est le nombre total de permutations des étiquettes, alors vous pouvez obtenir une distribution de la statistique que vous se soucier de. Ensuite, vous vérifiez le quantile de la quantité observée

KevinKim

Réponses:

La littérature distingue deux types de tests de permutations: (1) le test de randomisation est le test de permutation où l'échangeabilité est satisfaite par l'assignation aléatoire d'unités expérimentales aux conditions; (2) le test de permutation est exactement le même test mais appliqué à une situation où d'autres hypothèses (c.-à-d. Autres que l'assignation aléatoire) sont nécessaires pour justifier l'échangeabilité.

Quelques références concernant les conventions de dénomination (ie, randomisation vs permutation): Kempthorne & Doerfler, Biometrika, 1969; Edgington & Onghena, Randomization Tests, 4e éd., 2007

Pour les hypothèses, le test de randomisation (c'est-à-dire le test de randomisation de Fisher pour les données expérimentales) ne requiert que ce que Donald Rubin appelle l'hypothèse de la valeur unitaire de traitement stable (SUTVA). Voir le commentaire de Rubin de 1980 sur l'article de Basu dans JASA. SUTVA est également l'une des hypothèses fondamentales (avec une forte ignorabilité) pour l'inférence causale dans le modèle de résultats potentiels de Neyman-Rubin (cf. le document JASA de Paul Holland, 1986). Essentiellement, SUTVA dit qu'il n'y a pas d'interférence entre les unités et que les conditions de traitement sont les mêmes pour tous les bénéficiaires. Plus formellement, SUTVA suppose l'indépendance entre les résultats potentiels et le mécanisme d'affectation.

Considérez le problème à deux échantillons avec des participants assignés au hasard à un groupe témoin ou à un groupe de traitement. SUTVA serait violé si, par exemple, deux participants à l'étude étaient au courant et que le statut d'affectation de l'un d'eux exerçait une certaine influence sur le résultat de l'autre. C'est ce que l'on entend par aucune interférence entre les unités.

La discussion ci-dessus s'applique au test de randomisation dans lequel les participants ont été assignés au hasard à des groupes. Dans le cadre d'un test de permutation, SUTVA est également nécessaire, mais il peut ne pas reposer sur la randomisation car il n'y en avait pas.

En l'absence d'assignation aléatoire, la validité des tests de permutation peut s'appuyer sur des hypothèses de distribution comme une forme de distribution identique ou des distributions symétriques (selon le test) pour satisfaire à l'interchangeabilité (voir Box et Anderson, JRSSB, 1955).

Dans un article intéressant, Hayes, Psych Methods, 1996, montre par simulation comment les taux d'erreur de type I peuvent devenir gonflés si des tests de permutation sont utilisés avec des données non randomisées.

bsbk
la source

-5

Voir «Introduction à l'analyse des données quantifiées et aux tests de permutation» (page 88).

Davester
la source

(-) Donner une citation n'est pas une réponse. Tout d'abord, quelqu'un ne pouvait pas avoir le livre que vous citez. Deuxièmement, vous ne fournissez même pas de référence valide, nous ne pouvons que deviner ce que vous citez!

Tim

J'ai recherché ce document (il est librement accessible, btw: merci!). Cependant, il ne répond pas à la question. Tout ce qu'il dit de la pertinence à la p. 88 est «Les tests de permutation ne reposent pas sur des hypothèses de distribution traditionnelles, mais plutôt sur le modèle de randomisation de RA Fisher (1935/1990)». Nous vous serions reconnaissants si vous vous sentiez enclin à développer ce point dans une réponse élargie.

whuber

L'article donne des références où vous pouvez aller pour trouver des hypothèses de test de permutation. Désolé mais je n'ai pas le temps de chercher ceux qui ont posé la question.

Davester

Ensuite, vous n'avez pas répondu à la question.

neuronet