Taille de l'échantillon pour les proportions dans les mesures répétées

J'essaie d'aider un scientifique à concevoir une étude sur la présence de microbes de salmonelles. Il aimerait comparer une formulation antimicrobienne expérimentale avec un chlore (eau de javel) dans les élevages de volailles. Étant donné que les taux de fond des salmonelles varient au fil du temps, il prévoit de mesurer le pourcentage de volailles avec salmonelles avant le traitement et après le traitement. Ainsi, la mesure sera la différence de% avant / après salmonelle pour les formules expérimentales par rapport au chlore.

Quelqu'un peut-il indiquer comment estimer les tailles d'échantillon nécessaires? Disons que le taux de fond est de 50%; après l'eau de Javel, c'est 20%; et nous voulons détecter si la formulation expérimentale modifie le taux de +/- 10%. Merci

EDIT: Ce qui me pose problème, c'est comment intégrer les taux de base. Appelons-les p3 et p4, les taux de salmonelles "avant" pour les échantillons de javel et expérimentaux, respectivement. La statistique à estimer est donc la différence des différences: Expérimental (Après-Avant) - Eau de Javel (Après-Avant) = (p0-p2) - (p3-p1). Pour tenir pleinement compte de la variation d'échantillonnage des taux «avant» p2 et p3 dans le calcul de la taille de l'échantillon --- est-ce aussi simple que d'utiliser p0 (1-p0) + p1 (1-p1) + p2 (1-p2) + p3 (1-p3) partout où il y a un terme de variation dans l'équation de la taille de l'échantillon? Soit toutes les tailles d'échantillons égales, n1 = n2 = n.

sample-size repeated-measures proportion Paul
la source

C'est une excellente question. La solution optimale dépendra de certains éléments supplémentaires, notamment: a) les principaux éléments du coût, y compris le coût d'inclure une ferme et le coût de la mesure d'un sujet; et (b) la conception expérimentale. Par exemple, les solutions de traitement et de contrôle seront-elles appliquées à chaque ferme (un bon choix, mais non sans ses problèmes potentiels) ou pourrez-vous appliquer une seule solution à chaque ferme? Les sujets seront-ils regroupés (physiquement) dans les fermes ou traités et échantillonnés vraiment au hasard?

whuber

J'ai intégré votre réponse d'extension dans la question.

Réponses:

Essayons une approximation de premier ordre en supposant un échantillonnage aléatoire simple et une proportion constante d'infection pour tout traitement. Supposons que la taille de l'échantillon est suffisamment grande pour qu'une approximation normale puisse être utilisée dans un test d'hypothèse sur les proportions afin que nous puissions calculer la statistique az comme ceci

$z = \frac{p_t - p_0}{\sqrt{p_0(1-p_0)(\frac{1}{n_1}+\frac{1}{n_2})}}$

Il s'agit de la statistique d'échantillon pour un test à deux échantillons, nouvelle formule contre eau de Javel, car nous nous attendons à ce que l'effet de l'eau de Javel soit aléatoire ainsi que l'effet de la nouvelle formule.

Soit alors , car les expériences équilibrées ont la plus grande puissance, et utilisez vos spécifications qui , . Pour atteindre une statistique de test (erreur de type I d'environ 5%), cela équivaut à . Il s'agit d'une taille d'échantillon raisonnable pour que l'approximation normale fonctionne, mais c'est certainement une limite inférieure. $n = n_1 = n_2$ $|p_t - p_0| \geq 0.1$ $p_0 = 0.2$ $|z| \geq 2$ $n \approx 128$

Je recommanderais de faire un calcul similaire en fonction de la puissance souhaitée pour le test afin de contrôler l'erreur de type II, car une conception sous-alimentée a une forte probabilité de manquer un effet réel.

Une fois que vous avez fait tout ce travail de base, commencez à regarder les adresses whuber . En particulier, il ne ressort pas clairement de votre énoncé du problème si les échantillons de volaille mesurés sont différents groupes de sujets ou les mêmes groupes de sujets. S'ils sont identiques, vous êtes en test t ou en mesures répétées, et vous avez besoin de quelqu'un de plus intelligent que moi pour vous aider!

Mike Anderson
la source

Bon début (+1). La formule a besoin d'une correction. La variance de la différence des proportions est égale à p0 (1-p0) / n0 + p1 (1-p1) / n1. Avec n0 = n1 = n et p0 = 0,5, p1 = 0,2, cela équivaut à 0,41 / n, ce qui implique n = 41 z ^ 2. Notez également qu'il s'agit d'un test unilatéral, donc z = 1,65 fonctionne correctement. (Une certaine précision est nécessaire ici parce que le résultat est sensible à la quadrature de z.) Quoi qu'il en soit, ces calculs établissent qu'environ 10 ^ 2 sujets indépendants devront être testés si ce modèle est correct. (Je ne m'attends pas à ce que l'eau de Javel ou la nouvelle formule ait des effets "aléatoires".)

whuber

Mike Anderson et Whuber, merci pour vos suggestions. Vous avez posé de bonnes questions, auxquelles j'essaierai de répondre. Les unités expérimentales de volaille seront aléatoires et non de grappes. Pour l'instant, le coût n'est pas une considération.

Paul