Quelle est l'intuition derrière les échantillons échangeables sous l'hypothèse nulle?

Les tests de permutation (également appelés test de randomisation, test de re-randomisation ou test exact) sont très utiles et s'avèrent utiles lorsque l'hypothèse de distribution normale requise par exemple t-testn'est pas remplie et lorsque la transformation des valeurs par classement des un test non paramétrique comme Mann-Whitney-U-testcela entraînerait la perte de plus d'informations. Cependant, une et une seule hypothèse à ne pas négliger lors de l'utilisation de ce type de test est l'hypothèse d'échangeabilité des échantillons sous l'hypothèse nulle. Il est également à noter que ce type d'approche peut également être appliqué lorsqu'il existe plus de deux échantillons comme celui implémenté dans le coinpackage R.

Pouvez-vous utiliser un langage figuratif ou une intuition conceptuelle en anglais simple pour illustrer cette hypothèse? Ce serait très utile pour clarifier cette question oubliée parmi les non-statisticiens comme moi.

Remarque:
Il serait très utile de mentionner un cas où l'application d'un test de permutation ne tient pas ou n'est pas valide dans la même hypothèse.

Mise à jour:
Supposons que 50 sujets soient prélevés au hasard dans la clinique locale de mon district. Ils ont été assignés au hasard au médicament reçu ou à un placebo dans un rapport de 1: 1. Ils ont tous été mesurés pour le paramètre 1 Par1à V1 (ligne de base), V2 (3 mois plus tard) et V3 (1 an plus tard). Les 50 sujets peuvent être sous-groupés en 2 groupes en fonction de la fonction A; Un positif = 20 et un négatif = 30. Ils peuvent également être sous-groupés en 2 autres groupes en fonction de la caractéristique B; B positif = 15 et B négatif = 35.
Maintenant, j'ai des valeurs de Par1tous les sujets à toutes les visites. Dans l'hypothèse de l'interchangeabilité, puis-je faire une comparaison entre les niveaux d' Par1utilisation du test de permutation si je voulais:
- Comparer les sujets avec le médicament à ceux qui ont reçu le placebo au V2?
- Comparer les sujets avec la fonctionnalité A avec ceux ayant la fonctionnalité B à V2?
- Comparer les sujets ayant la caractéristique A à V2 avec ceux ayant la caractéristique A mais à V3?
- Dans quelle situation cette comparaison serait invalide et violerait l'hypothèse d'échangeabilité?

hypothesis-testing permutation-test exchangeability r statistical-significance loess data-visualization normal-distribution pdf ggplot2 kernel-smoothing probability self-study expected-value normal-distribution prior correlation time-series regression heteroscedasticity estimation estimators fisher-information data-visualization repeated-measures binary-data panel-data mathematical-statistics coefficient-of-variation normal-distribution order-statistics regression machine-learning one-class probability estimators forecasting prediction validation finance measurement-error variance mean spatial monte-carlo data-visualization boxplot sampling uniform chi-squared goodness-of-fit probability mixture theory gaussian-mixture regression statistical-significance p-value bootstrap regression multicollinearity correlation r poisson-distribution survival regression categorical-data ordinal-data ordered-logit regression interaction time-series machine-learning forecasting cross-validation binomial multiple-comparisons simulation false-discovery-rate r clustering frequency wilcoxon-mann-whitney wilcoxon-signed-rank r svm t-test missing-data excel r numerical-integration r random-variable lme4-nlme mixed-model weighted-regression power-law errors-in-variables machine-learning classification entropy information-theory mutual-information doctorat
la source

Supposons que j'avais chaque observation sur une feuille séparée de papier à feuilles mobiles et que je vous ai tendu la pile, j'ai glissé et les feuilles ont volé dans toutes les directions alors qu'elles s'installaient au sol. Ce serait dommage si cela détruisait la validité du test que vous espériez effectuer sur ces données. Si vos observations sont échangeables et que vous appliquiez un test basé sur cela, vous me consoleriez et me diriez de ne pas m'inquiéter tout en m'aidant à ramasser les papiers sur le sol. Sinon, et la collecte de données était particulièrement coûteuse, je devrais peut-être courir pour ma vie.

cardinal du

D'autre part, l' ordre ne soit pour des choses telles que les données de séries chronologiques (en général) et les essais doivent généralement respecter cet ordre d'une manière appropriée.

cardinal du

@cardinal, alors que votre histoire intuitive a dessiné une image vivante de la façon dont cette hypothèse ressemble, mais je suis toujours confus quant à la façon de juger si les papiers précieux tombés étaient échangeables ou non. Vous pouvez vous présenter pour un autre commentaire si c'est possible!

doctorat

$f_{XYZ}(x = 1, y=3, z=2)=f_{XYZ}(x=3,y=2,z=1)$ , etc). Si ce n'est pas le cas, le comptage des permutations n'est pas un moyen valide de tester l'hypothèse nulle, car chaque permutation aura un poids différent (probabilité / densité). Tests de Permutation dépendent de chaque attribution d'un ensemble donné de numérique valeurs à vos variables ayant la même densité / probabilité.

$f(x_1=1,x_2=2,X_3=3...X_N=N)\neq f(x_1=N,x_2=N-1,X_3=N-2...X_N=1)$

la source

+1, bien que l'échange soit bien expliqué, mais j'ai quand même été trébuché en essayant d'appliquer la métaphore des pots sur l'étude en cours. (voir la mise à jour de la question). Compte tenu de la durée des visites et des sous-groupes en fonction des fonctionnalités, comment puis-je juger si la comparaison de ces valeurs serait échangeable ou non?

doctorat

@doctorate: il semble que vous stratifiez vos groupes en fonction de facteurs pertinents pour le résultat de Par1, n'est-ce pas? Tant que vous utilisez des permutations dans un quadrant de fermeture A / B particulier, je suppose que vos sujets sont échangeables. Votre premier test, qui couvrira toutes les fonctionnalités, devra être traité plus avant avant de pouvoir utiliser un test qui repose sur l'échange. en particulier, vous devez quantifier l'effet du traitement et corriger les effets de confusion des caractéristiques A et B - sinon, la taille du groupe influencera les résultats globaux (paradoxe de simpson)

@doctorate: J'ai réalisé que mon commentaire ci-dessus était peut-être un peu oblique par rapport à ce que vous vouliez: les pots dans votre cas seraient les paires de fonctionnalités, c'est-à-dire (A +, B +), (A-, B +), (A +, B -), (B-, A-) pour un total de 4 "pots". Est-ce que cela aide à le rendre plus concret?

Tks, mais ce qui confond les non-statisticiens comme moi, c'est comment peut-on juger si cette hypothèse a été satisfaite ou non? il existe souvent des tests pour examiner les hypothèses, par exemple, pour la normalité, il y a le test de Shapiro-Wilk. Mais je me demande quel test examinerait l'échange. sinon, la définition serait très difficile ou vague et deux statisticiens pourraient ne pas s'entendre sur tel ou tel sous-groupe. Comme vous l'avez mentionné, dans le quadrant A / B aucun problème, mais dans Drug / Placebo, vous avez montré une certaine inquiétude. Existe-t-il un test d'acide pour cette hypothèse?

doctorat

En ce qui concerne l'échange, il n'y a pas de "test" pour l'échange. Contrairement à l'indépendance (qui est testable), l'échange est plus une hypothèse de modélisation que si vous aviez prélevé des échantillons répétés comme celui que vous avez pris, vous constateriez que chaque permutation se produit exactement la même fraction du temps. Vous n'avez qu'un seul échantillon, vous ne pouvez donc pas le "tester".

Quelle est l'intuition derrière les échantillons échangeables sous l'hypothèse nulle?

Réponses: