Description de l'étude:
J'ai observé une erreur courante parmi les méta-analyses, en ce qui concerne le traitement de la réplication intra-étude. Il n'est pas clair pour moi si l'erreur invalide les études lorsque des hypothèses sont énoncées. Cependant, si je comprends bien, ces hypothèses violent une prémisse de base des statistiques.
À titre d'exemple, une étude teste les effets des produits chimiques sur la réponse Y .
L'analyse est effectuée sur le rapport de réponse logarithmique: le rapport du traitement (en présence de X ) au témoin Y 0 (pas X ):
Certaines des études incluses dans la méta-analyse contiennent des traitements multiples, par exemple différents niveaux ou formes chimiques de . Pour chaque traitement, il existe une valeur différente de R , bien que R utilise toujours la même valeur de Y 0 .
Les méthodes indiquent:
Des questions:
- N'est-ce pas cette pseudoréplication?
- Est-ce inapproprié même si la violation de l'indépendance est mentionnée dans les méthodes?
- Quel serait un moyen facile (par exemple dans la capacité d'un simple logiciel de méta-analyse) de gérer la réplication de l'étude?
Pensées initiales:
- Résumer les résultats de chaque étude, par exemple en prenant la réponse moyenne
- Sélectionnez un seul traitement dans chaque étude en fonction de critères a priori (par exemple, dose la plus élevée, première mesure)?
Y a-t-il d'autres solutions?
la source
Réponses:
Oui, c'est un problème car il y a une dépendance d'échantillonnage dans les réponses qui devait être prise en compte (bien que parfois l'effet puisse être négligeable et nous violons l'hypothèse tout le temps lorsque nous effectuons des analyses statistiques). Il existe des méthodes pour y remédier, une approche consiste à inclure les covariances entre les expériences connexes (blocs hors diagonale) dans la matrice de variance-covariance des erreurs (voir par exemple Hedges et al., 2010). Heureusement avec les rapports de log c'est assez facile. Vous pouvez obtenir des covariances approximatives entre les expériences car la variance (var) de log R est (si Yx et Y0 sont des groupes indépendants): log Yx - log Y0, pour suivre la notation de la question, Yx se référant au groupe expérimental et Y0 le groupe de contrôle. La covariance (cov) entre deux valeurs (par exemple traitement 1 ou traitement 2) pour log R est cov (loge Yx_1 - log Y0, log Yx_2 - log Y0), qui est égal à var (log Y0), et est calculé comme SD_Y0 / (n_Y0 * Y0), où SD_Y0 est l'écart type de Y0, n_Y0 est la taille de l'échantillon dans le traitement de contrôle et Y0 est la valeur du traitement témoin. Nous pouvons maintenant brancher toute la matrice variance-covariance dans notre modèle au lieu d'utiliser uniquement les variances (ei), qui est la manière classique d'effectuer une méta-analyse. Un exemple de ceci peut être trouvé dansLimpens et al. 2011 en utilisant le package metahdep dans R (sur le bioconducteur), ou Stevens et Taylor 2009 pour Hedge's D.
Si vous voulez rester très simple, je serais tenté d'ignorer le problème et d'essayer d'évaluer l'effet de la dépendance à l'échantillonnage (par exemple, combien de traitements y a-t-il dans les études? Comment les résultats changent-ils si je n'utilise qu'un seul traitement? Etc.) .
la source
Oui, c'est un problème.
Oui, c'est inapproprié même si au moins il est transparent sur ce qu'il fait (il obtient des points pour la transparence, mais n'est toujours pas satisfaisant).
Je doute qu'il existe un "moyen facile" de résoudre ce problème. Je ne connais pas grand-chose aux approches adoptées pour la méta-analyse, mais s'il existe un logiciel de méta-analyse spécifique et que des recherches comme celle-ci sont produites à l'aide de celui-ci et publiées, cela pourrait bien être l'approche courante. L'une ou l'autre de vos réponses proposées perd une certaine granularité des informations de chaque étude (c'est-à-dire le problème opposé de ce que les éditeurs ont fait).
La solution évidente est un modèle à effets mixtes (c'est-à-dire à plusieurs niveaux) avec étude comme facteur aléatoire. Je suggérerais d'utiliser un logiciel statistique spécialisé pour cela si un logiciel de méta-analyse ne peut pas le faire. Vous pouvez toujours utiliser le logiciel de méta-analyse pour le stockage et le traitement des données, et simplement exporter les données vers R, Stata ou SAS pour l'analyse.
la source