J'essaie d'aider un scientifique à concevoir une étude sur la présence de microbes de salmonelles. Il aimerait comparer une formulation antimicrobienne expérimentale avec un chlore (eau de javel) dans les élevages de volailles. Étant donné que les taux de fond des salmonelles varient au fil du temps, il prévoit de mesurer le pourcentage de volailles avec salmonelles avant le traitement et après le traitement. Ainsi, la mesure sera la différence de% avant / après salmonelle pour les formules expérimentales par rapport au chlore.
Quelqu'un peut-il indiquer comment estimer les tailles d'échantillon nécessaires? Disons que le taux de fond est de 50%; après l'eau de Javel, c'est 20%; et nous voulons détecter si la formulation expérimentale modifie le taux de +/- 10%. Merci
EDIT: Ce qui me pose problème, c'est comment intégrer les taux de base. Appelons-les p3 et p4, les taux de salmonelles "avant" pour les échantillons de javel et expérimentaux, respectivement. La statistique à estimer est donc la différence des différences: Expérimental (Après-Avant) - Eau de Javel (Après-Avant) = (p0-p2) - (p3-p1). Pour tenir pleinement compte de la variation d'échantillonnage des taux «avant» p2 et p3 dans le calcul de la taille de l'échantillon --- est-ce aussi simple que d'utiliser p0 (1-p0) + p1 (1-p1) + p2 (1-p2) + p3 (1-p3) partout où il y a un terme de variation dans l'équation de la taille de l'échantillon? Soit toutes les tailles d'échantillons égales, n1 = n2 = n.
Réponses:
Essayons une approximation de premier ordre en supposant un échantillonnage aléatoire simple et une proportion constante d'infection pour tout traitement. Supposons que la taille de l'échantillon est suffisamment grande pour qu'une approximation normale puisse être utilisée dans un test d'hypothèse sur les proportions afin que nous puissions calculer la statistique az comme ceci
Il s'agit de la statistique d'échantillon pour un test à deux échantillons, nouvelle formule contre eau de Javel, car nous nous attendons à ce que l'effet de l'eau de Javel soit aléatoire ainsi que l'effet de la nouvelle formule.
Soit alors , car les expériences équilibrées ont la plus grande puissance, et utilisez vos spécifications qui , . Pour atteindre une statistique de test (erreur de type I d'environ 5%), cela équivaut à . Il s'agit d'une taille d'échantillon raisonnable pour que l'approximation normale fonctionne, mais c'est certainement une limite inférieure.n = n1= n2 | pt- p0| ≥0,1 p0= 0,2 | z| ≥2 n ≈ 128
Je recommanderais de faire un calcul similaire en fonction de la puissance souhaitée pour le test afin de contrôler l'erreur de type II, car une conception sous-alimentée a une forte probabilité de manquer un effet réel.
Une fois que vous avez fait tout ce travail de base, commencez à regarder les adresses whuber . En particulier, il ne ressort pas clairement de votre énoncé du problème si les échantillons de volaille mesurés sont différents groupes de sujets ou les mêmes groupes de sujets. S'ils sont identiques, vous êtes en test t ou en mesures répétées, et vous avez besoin de quelqu'un de plus intelligent que moi pour vous aider!
la source