Existe-t-il un test statistique pour comparer deux échantillons de taille 1 et 3?

19

Pour un projet d'écologie, mon groupe de laboratoire a ajouté du vinaigre à 4 réservoirs contenant des volumes égaux d'eau d'étang, 1 témoin sans élodée (une plante aquatique) et 3 traitements avec la même quantité d'élodée dans chacun. L'ajout de vinaigre avait pour but de réduire le pH. L'hypothèse était que les réservoirs contenant de l'élodée retrouveraient leur pH normal plus rapidement. C'était effectivement le cas. Nous avons mesuré le pH de chaque réservoir quotidiennement pendant environ deux semaines. Tous les réservoirs ont finalement retrouvé leur pH naturel, mais le temps que cela a pris a été beaucoup plus court pour les réservoirs contenant de l'élodée.

Lorsque nous avons informé notre professeur de notre conception expérimentale, il a déclaré qu'il n'existait aucun test statistique pouvant être effectué sur les données pour comparer le contrôle au traitement. Parce qu'il n'y avait pas de répétition pour le contrôle (nous n'avons utilisé qu'un seul réservoir de contrôle), nous ne pouvons pas calculer la variance et nous ne pouvons donc pas comparer les moyennes d'échantillonnage du contrôle et du traitement. Donc ma question est, est-ce vrai? Je comprends vraiment ce qu'il veut dire. Par exemple, si vous avez pris la taille d'un homme et d'une femme, vous ne pouvez pas tirer de conclusions sur leurs populations respectives. Mais nous avons fait 3 traitements, et l'écart était faible. Il semble raisonnable de supposer que la variance serait similaire dans le contrôle?

Mise à jour:

Merci pour l'excellente réponse. Nous avons obtenu plus d'eau et d'élodée de la zone humide et avons décidé de refaire l'expérience avec des réservoirs plus petits, mais cette fois avec 5 contrôles et 5 traitements. Nous allions combiner cela avec nos données d'origine, mais le pH de départ des réservoirs était suffisamment différent pour qu'il ne semble pas valide de considérer la nouvelle expérience comme échantillonnée à partir de la même population que l'expérience d'origine.

Nous avons envisagé d'ajouter différentes quantités d'élodée et d'essayer de corréler la vitesse de remédiation du pH (mesurée comme le temps écoulé jusqu'à ce que le pH revienne à sa valeur d'origine) avec la quantité d'élodée, mais nous avons décidé que ce n'était pas nécessaire. Notre objectif est seulement de montrer que l'élodée fait une différence positive, pas de construire une sorte de modèle prédictif pour exactement comment le pH répond à différentes quantités d'élodée. Il serait intéressant de déterminer la quantité optimale d'élodée, mais ce n'est probablement que la quantité maximale qui peut survivre. Essayer d'ajuster une courbe de régression aux données ne serait pas particulièrement éclairant en raison des divers changements complexes qui se produisent dans la communauté lors de l'ajout d'une grande quantité. L'élodée meurt, se décompose, de nouveaux organismes commencent à dominer, etc.

Simon Hunt
la source
4
Avez-vous ajouté la même quantité d'Elodea à chacun des 3 réservoirs de «traitement»?
gung - Rétablir Monica
2
Oui, nous avons ajouté la même quantité d'Elodea à chaque traitement.
Simon Hunt

Réponses:

21

Notez la question de Gung; Cela compte. Je suppose que le traitement était le même pour tous les réservoirs du groupe de traitement.

Si vous pouvez affirmer que la variance serait égale pour les deux groupes (ce que vous supposeriez généralement pour un test t à deux échantillons), vous pouvez faire un test. Vous ne pouvez tout simplement pas vérifier cette hypothèse, quelle que soit la gravité de sa violation.

Les préoccupations exprimées dans cette réponse à une question connexe sont encore plus pertinentes pour votre situation, mais vous pouvez en faire moins.

[Vous demandez s'il est raisonnable de supposer que les écarts sont égaux. Nous ne pouvons pas répondre à cela pour vous, c'est quelque chose qu'il faudrait convaincre des experts en la matière (c.-à-d. Les écologistes) était une hypothèse raisonnable. Y a-t-il d'autres études où de tels niveaux ont été mesurés sous traitement et contrôle? D'autres où des tests similaires ( t-tests ou anova en particulier - je parie que vous pouvez trouver un meilleur précédent) ont été effectués ou des hypothèses similaires faites? Une forme de raisonnement général que vous pouvez voir s’appliquer?]

Si est la moyenne de l'échantillon du traitement et est la moyenne du contrôle, et les deux proviennent de distributions normales avec variance , alors aura la moyenne et la variance que l'un des soit .x¯y¯σ2X¯-y¯μX-μyσ2(1/nX+1/ny)n

Donc, quand vaut 1,ny

(X¯-y¯)sX1/nX+1

(où est l'écart type calculé à partir des traitements) sera réparti en (avec degrés de liberté) sous le zéro.sXtnX-1

Vous remarquerez peut-être qu'avec la meilleure estimation disponible de , utilisée pour , c'est exactement comme la formule test t à deux échantillons avec mis à 1.σsXspny

Éditer:

Voici une courbe de puissance simulée pour ce test. La taille de l'échantillon au zéro était de 10000, aux autres points de 1000. Comme vous le voyez, le taux de rejet au zéro est de 0,05, et la courbe de puissance, bien qu'elle nécessite une grande différence dans les moyens de population pour avoir une puissance décente, a le bonne forme. Autrement dit, ce test fait ce qu'il est censé faire.

courbe de puissance

(Fin du montage)

Avec des échantillons si petits, cela sera toutefois quelque peu sensible aux hypothèses de distribution.

Si vous êtes prêt à faire des hypothèses différentes ou si vous souhaitez tester l'égalité d'une autre quantité de population, certains tests peuvent toujours être possibles.

Donc tout n'est pas perdu ... mais dans la mesure du possible, il est généralement préférable d'avoir au moins une certaine réplication dans les deux groupes.

Glen_b -Reinstate Monica
la source
1
Notez que vous devrez suivre les formules @Glen_b décrites. Excel et Minitab ne calculeront pas cela.
zbicyclist
10
(+1) Une approche équivalente (utilisant la même formule) - et donc plus de munitions pour justifier cette réponse - est que vous pouvez calculer un intervalle de prédiction pour une valeur future à partir du groupe de traitement. Si la valeur de contrôle ne tombe pas dans cet intervalle de prédiction, vous avez des preuves significatives d'une différence entre les deux groupes. La différence pourrait être une combinaison d'une différence de moyenne ou d' une différence de variances, mais il y a (probablement) une différence.
whuber
3
@bdemarest Une pensée intéressante, mais cela ne fonctionne pas. Il affirme que la valeur '12' est connue exactement (au lieu d'être une observation aléatoire à partir d'une distribution avec sd ), conduisant à la formule - dans ce cas particulier, faire de la valeur sous la racine carrée un quart de ce qu'elle devrait et donc faire la valeur deux fois plus grande qu'elle devrait l'être. σ(X¯-12)sX1/nXt
Glen_b -Reinstate Monica
2
@Glen_b: Je ne sais pas si cela a changé en novembre dernier, mais R 3.0 fera un test t groupé lorsque l'une des tailles d'échantillon est une, et donnera la même réponse qu'un anova.
Aaron - Rétablir Monica
2
Pour tous ceux qui souhaitent l'essayer en R: t.test(x=c(4.5,4.8,4.6),y=5.2, var.equal=TRUE) - il semble que cela fonctionne à la fois dans R2.15.2 et R3.0.0 (les deux seules versions que j'ai à portée de main).
Glen_b -Reinstate Monica