Calcul de la taille de l'échantillon paramétrique et analyse non paramétrique

12

Je suis curieux de savoir si quelqu'un a une référence spécifique (texte ou article de revue) pour soutenir la pratique courante dans la littérature médicale d'effectuer le calcul de la taille de l'échantillon en utilisant des méthodes paramétriques (c'est-à-dire en supposant une distribution normale et une certaine variance des mesures) quand l'analyse du résultat de l'essai principal sera effectuée à l'aide de méthodes non paramétriques.

Un exemple: le résultat principal est le temps de vomissement après avoir donné un certain médicament, qui est connu pour avoir une valeur moyenne de 20 minutes (SD 6 minutes), mais a une distribution sensiblement asymétrique à droite. Le calcul de la taille de l'échantillon est effectué avec les hypothèses énumérées ci-dessus, en utilisant la formule

,n(par groupe)=F(α,β)×(2σ2/(μ1-μ2)2)

change en fonction des erreurs α et β souhaitées .F(α,β)αβ

Cependant, en raison de l'asymétrie de la distribution, l'analyse du résultat principal sera basée sur les classements (méthode non paramétrique telle que le test de Mann Whitney U).

Ce schéma est-il pris en charge par les auteurs dans la littérature statistique, ou faut-il effectuer des estimations de taille d'échantillon non paramétriques (et comment les réaliser)?

Je pense que, pour faciliter le calcul, il est acceptable de faire la pratique ci-dessus. Après tout, les estimations de la taille de l'échantillon ne sont que cela - des estimations qui font déjà plusieurs hypothèses - qui sont toutes probablement légèrement (ou très!) Imprécises. Cependant, je suis curieux de savoir ce que les autres pensent, et plus précisément de savoir s'il existe des références à l'appui de ce raisonnement.

Merci beaucoup pour toute assistance.

pmgjones
la source

Réponses:

4

Cela me semble douteux. Les méthodes non paramétriques impliquent presque toujours plus de degrés de liberté que les méthodes paramétriques et nécessitent donc plus de données. Dans votre exemple particulier, le test de Mann-Whitney a une puissance inférieure à celle du test t et donc davantage de données sont nécessaires pour la même puissance et la même taille spécifiées.

Un moyen simple de calculer la taille de l'échantillon pour n'importe quelle méthode (non paramétrique ou autre) consiste à utiliser une approche bootstrap.

Rob Hyndman
la source
5
Je suis d'accord avec vous, bien que la plupart des calculs de taille d'échantillon qui sont effectués lors de la conception des ECR soient basés sur des modèles paramétriques. J'aime l'approche bootstrap, mais il semble que très peu d'études en dépendent. Je viens de trouver ces articles qui pourraient être intéressants: bit.ly/djzzeS , bit.ly/atCWz3 , et celui-ci va dans la direction opposée bit.ly/cwjTHe pour les échelles de mesure de la santé.
chl
6
Je suis d'accord sur l'approche bootstrap. Mais le pouvoir n'est pas fonction des degrés de liberté. Dans de nombreux cas, y compris celui-ci, le test de Mann-Whitney a souvent une plus grande puissance que le test t. Voir tbf.coe.wayne.edu/jmasm/sawilowsky_misconceptions.pdf . En général, la puissance d'un test paramétrique est bonne lorsque les hypothèses paramétriques sont vraies, mais peut être plus faible - parfois de manière drastique - lorsque ces hypothèses sont violées, alors que de bons tests non paramétriques conservent leur puissance.
whuber
@RobHyndman - désolé de déterrer un vieux fil d'il y a 6 ans, mais je me demande si vous pouvez fournir une référence pour votre dernière phrase. Comment puis-je utiliser une approche bootstrap pour obtenir un calcul de taille d'échantillon? Je suppose ici que je n'ai pas encore collecté les données (parce que j'essaie de savoir combien de données collecter), mais je connais la puissance que je veux, le niveau de signification et la taille de l'effet que je veux détecter. Merci!
David White
D'accord, je suppose que cela ne peut fonctionner que si vous avez une étude préliminaire à rééchantillonner. Pour une première étude sans connaissance préalable, il semble préférable de calculer la taille de l'effet à partir de la distribution normale (ou d'une distribution différente si la théorie suggère que les données devraient être distribuées de cette façon) et d'ajouter un peu pour tenir compte d'une éventuelle non-normalité. Une fois que vous avez une étude, vous pouvez utiliser le boostrapping pour calculer la taille des échantillons afin de détecter différentes tailles d'effet dans les études suivantes. Vous pouvez même ajuster une courbe de la taille de l'effet par rapport à n sur la base de l'amorçage de plusieurs valeurs de n.
David White
4

Certaines personnes semblent utiliser un concept d'efficacité relative asymptotique de Pitman (ARE) pour gonfler la taille de l'échantillon obtenue en utilisant une formule de taille d'échantillon pour un test paramétrique. Ironiquement, pour le calculer, il faut à nouveau supposer une distribution ... voir par exemple Taille d'échantillon pour le test U de Mann-Whitney Il y a quelques liens à la fin de l'article qui fournissent des pointeurs pour une lecture plus approfondie.

psj
la source