Erreur globale de type I lors de tests répétés d'accumulation de données

12

J'ai une question sur les méthodes séquentielles de groupe .

Selon Wikipedia:

Dans un essai randomisé avec deux groupes de traitement, le test séquentiel de groupe classique est utilisé de la manière suivante: Si n sujets dans chaque groupe sont disponibles, une analyse intermédiaire est effectuée sur les 2n sujets. L'analyse statistique est effectuée pour comparer les deux groupes, et si l'hypothèse alternative est acceptée, l'essai est terminé. Sinon, l'essai se poursuit pour 2 autres sujets, avec n sujets par groupe. L'analyse statistique est à nouveau effectuée sur les 4n sujets. Si l'alternative est acceptée, le procès prend fin. Sinon, il continue avec des évaluations périodiques jusqu'à ce que N ensembles de 2n sujets soient disponibles. À ce stade, le dernier test statistique est effectué et l'essai est interrompu

Mais en testant à plusieurs reprises l'accumulation de données de cette manière, le niveau d'erreur de type I est gonflé ...

Si les échantillons étaient indépendants les uns des autres, l'erreur globale de type I, , seraitα

α=1(1α)k

est le niveau de chaque test, et k est le nombre de regards intermédiaires.αk

Mais les échantillons ne sont pas indépendants car ils se chevauchent. En supposant que les analyses intermédiaires sont effectuées à des niveaux d’information égaux, on peut constater que

entrez la description de l'image ici

Pouvez-vous m'expliquer comment ce tableau est obtenu?

ocram
la source

Réponses:

12

Les diapositives suivantes, à travers 14, expliquent l'idée. Le fait, comme vous le constatez, est que la séquence des statistiques est corrélée.

z1Φz21/2(z1,z2)c=Φ1(10.05/2)α|z1|>c|z1|c|z2|>c

Ce graphique représente le pdf binormal et la région d'intégration (surface solide). PDF binormal, tracé de surface 3D

whuber
la source
Compris. Merci! La corrélation cor (z1, z2) est-elle difficile à obtenir?
ocram
z1z1z2
Merci beaucoup. Oui, la corrélation semble assez facile à calculer. En fait, il n'était pas clair pour moi que le contexte était une comparaison des moyennes de deux distributions normales. Maintenant, c'est clair et vous rendez tout le reste très clair aussi! Je vous remercie!
ocram
pourriez-vous fournir une formule (ou un code R) comment calculer cela pour par exemple n = 400? Je le ferais moi-même mais malheureusement je ne sais pas comment. Et comment devrais-je ajuster la formule si je veux calculer le taux d'erreur global si j'ai des comparaisons multiples (par exemple en comparant 4 proportions) et que je ne fais pas de correction comme Bonferroni et que je fais des tests répétés? Pourriez-vous m'aider avec ça?
Andreas