Trouver un groupe témoin comparable pour un groupe de traitement?

11

J'ai un groupe de traitement de taille 30 (30 écoles en Californie) qui a utilisé un logiciel supplémentaire de mathématiques. Dans une analyse simple, je voudrais comparer la croissance moyenne des élèves en mathématiques entre notre groupe de traitement et un groupe témoin comparable. Il existe de nombreuses écoles en Californie qui n'ont pas utilisé le logiciel. J'aimerais que le groupe de contrôle inclue des écoles performantes similaires (leurs scores de base soient similaires à ceux des écoles de traitement avec une marge d'erreur raisonnable). De plus, j'aimerais que la taille de l'échantillon du groupe témoin soit 3 fois supérieure à mon traitement (ici 90 écoles). Il y a beaucoup de choix parmi 90 écoles sur plus de 1000 écoles en Californie. Comment choisiriez-vous votre groupe de contrôle?

Sam
la source
1
Vous pouvez dire que plus il y a d'informations, mieux c'est. Utilisez toutes les écoles CA et installez un ANCOVA (en supposant que la distribution du contrôle et du traitement se chevauchent). Je suis d'accord, c'est bon. Cependant, je voudrais montrer que les deux groupes avaient un score de base moyen très similaire et une variance des scores dans la ligne de base, ce qui n'est pas possible si nous considérons l'ensemble de l'AC en particulier que le groupe de traitement sont des écoles plus peu performantes.
Sam
Désolé si cela semble inutile, mais j'ai voté pour fermer cette question. Comme il est écrit, il n'y a pas de réponse correcte et je ne suis pas sûr que la question porte sur les statistiques. La meilleure réponse pourrait bien être «lisez tout ce que vous pouvez sur la conception de la recherche». Mais si votre intention était de solliciter des opinions sur un aspect spécifique que vous avez en tête concernant la conception de cette situation, veuillez vous concentrer sur cela - cela devrait permettre une Q + A plus productive.
rolando2
1
@ rolando2: merci pour votre réponse. Je suis assez nouveau pour Cross Validated. Je pensais pouvoir y contribuer. J'ai commencé à contribuer à Stackoverflow il y a 2 jours, et même si j'ai passé un peu de temps, mais j'ai eu la réputation de 113. Ma première expérience a été un peu décevante que quelqu'un m'ait voté -1 et vous pensez que nous devrions fermer la question. Je suis statisticien et je travaille dans ce domaine depuis 3 ans et sur la base de mon expérience de travail avec des données réelles, je pense que c'est une question importante.
Sam
1
@jbowman: Merci. Je connais le site Web. En écrivant cette question, je voulais poser une question générale sur la façon dont les gens pensent de trouver un groupe témoin comparable. Supposons que nous ayons potentiellement 300 écoles comparables, comment en choisiriez-vous 90 pour votre analyse?
Sam
2
@Sepehr Je suis en désaccord avec roland2 sur la pertinence de votre question ici. Je pense que cela concerne la conception expérimentale et est donc approprié pour CV. En ce qui concerne le problème d'efficacité que j'ai soulevé, mon hypothèse implicite est que les deux populations ont les mêmes variances (ou du moins les variances sont presque égales). Dans ce cas, une estimation de la différence moyenne basée sur une taille d'échantillon totale fixe n sera moins précise lorsque les tailles d'échantillon sont inégales et s'aggravera à mesure que le déséquilibre augmentera.
Michael R. Chernick

Réponses:

1

Si je comprends bien, vous voulez trouver un équilibre optimal dans les covariables entre votre groupe témoin et votre groupe de traitement. Si c'est le cas, j'utiliserais une procédure de correspondance.

R package Matching possède toutes les fonctions nécessaires à cet effet, y compris certains outils pour évaluer si l'équilibre entre les groupes a été atteint après la correspondance. Consultez ce document avec des détails sur son utilisation et quelques exemples.

Aghila
la source