Pourquoi ne pas effectuer une méta-analyse sur des données partiellement simulées?

11

Contexte:

Une méta-analyse typique en psychologie pourrait chercher à modéliser la corrélation entre deux variables X et Y. L'analyse impliquerait généralement d'obtenir un ensemble de corrélations pertinentes à partir de la littérature ainsi que la taille des échantillons. Des formules peuvent ensuite être appliquées pour calculer une corrélation moyenne pondérée. Ensuite, des analyses peuvent être effectuées pour voir si les corrélations varient d'une étude à l'autre plus que ne le laisseraient supposer les simples effets d'un échantillonnage aléatoire.

De plus, les analyses peuvent être beaucoup plus complexes. Les estimations peuvent être ajustées pour la fiabilité, la restriction de plage, etc. Les corrélations peuvent être utilisées en combinaison pour explorer la modélisation d'équations méta structurelles ou la méta régression, etc.

Cependant, toutes ces analyses sont effectuées à l'aide de statistiques sommaires (par exemple, corrélations, rapports de cotes, différences moyennes normalisées) comme données d'entrée. Cela nécessite l'utilisation de formules et de procédures spéciales acceptant des statistiques sommaires.

Approche alternative à la méta-analyse

Ainsi, je réfléchissais à une approche alternative à la méta-analyse, où les données brutes sont utilisées en entrée. C'est-à-dire que pour une corrélation, les données d'entrée seraient les données brutes utilisées pour former la corrélation. De toute évidence, dans la plupart des méta-analyses, plusieurs sinon la plupart des données brutes réelles ne sont pas disponibles. Ainsi, une procédure de base pourrait ressembler à ceci:

Contactez tous les auteurs publiés à la recherche de données brutes et, le cas échéant, utilisez des données brutes réelles .
Pour les auteurs qui ne fournissent pas de données brutes, simulez les données brutes afin qu'elles aient des statistiques récapitulatives identiques à celles rapportées. Ces simulations pourraient également incorporer toute connaissance acquise à partir des données brutes (par exemple, si une variable est connue pour être biaisée, etc.).

Il me semble qu'une telle approche pourrait avoir plusieurs avantages:

Des outils statistiques qui utilisent des données brutes en entrée pourraient être utilisés pour des analyses
En obtenant au moins des données brutes réelles, les auteurs de méta-analyses seraient obligés de prendre en compte les problèmes liés aux données réelles (par exemple, valeurs aberrantes, distributions, etc.).

Question

Existe-t-il des problèmes avec la réalisation d'études de méta-analyse sur une combinaison de vraies données brutes et de données simulées pour avoir des statistiques sommaires identiques aux études publiées existantes?
Une telle approche serait-elle supérieure aux méthodes existantes pour effectuer des méta-analyses sur des statistiques sommaires?
Existe-t-il une documentation existante discutant, préconisant ou critiquant cette approche?

simulation meta-analysis Jeromy Anglim
la source

1

Re # 1: la plupart du temps, il semble qu'il serait incroyablement difficile de contraindre toutes les données dans le même format! Re # 2: ce sera à moins que a) vous n'utilisiez des méthodes particulièrement mauvaises, ou b) la statistique récapitulative soit également une statistique suffisante pour les paramètres qui vous intéressent.

Andy McKenzie

1

@Andy McKenzie Re # 1: C'est ce que je fais actuellement (c'est-à-dire une méta-analyse IPD). Étant donné que mes statistiques de résultats proviennent de modèles de régression, cela me semble l'approche la plus utile. Je sais que tu as écrit "la plupart du temps" :-)

Bernd Weiss

6

Il existe déjà des approches qui visent à synthétiser les données individuelles et agrégées des personnes. Les Sutton et al. (2008), l'article applique une approche bayésienne qui (à mon humble avis) présente certaines similitudes avec votre idée.

Riley, RD, Lambert, PC, Staessen, JA, Wang, J., Gueyffier, F., Thijs, L., et Boutitie, F. (2007). Méta-analyse des résultats continus combinant les données individuelles des patients et les données agrégées. Statistics in Medicine, 27 (11), 1870–1893. doi: 10.1002 / sim.3165 PDF
Riley, RD et Steyerberg, EW (2010). Méta ‐ analyse d'un résultat binaire à l'aide de données individuelles des participants et de données agrégées. Méthodes de synthèse de recherche, 1 (1), 2–19. doi: 10.1002 / jrsm.4
Sutton, AJ, Kendrick, D. et Coupland, CAC (2008). Méta-analyse des données individuelles et agrégées. Statistics in Medicine, 27 (5), 651–669.

Bernd Weiss
la source

10

Je remercie @Bernd de m'avoir indiqué dans la bonne direction. Voici quelques notes sur les références qu'il a mentionnées dans sa réponse, ainsi que certaines des références mentionnées dans ces articles.

Sutton et al (2008)

Sutton et al utilisent dans un contexte de santé les termes données individuelles des patients par rapport aux données agrégées .

Ils notent que l'analyse des données individuelles des patients est souvent considérée comme l'étalon-or pour la méta-analyse, citant Stewart et Clark (1995). Il est particulièrement utile pour évaluer la qualité des données et effectuer des analyses sur des valeurs non déclarées dans les rapports existants (par exemple, des analyses de sous-groupes particuliers). Naturellement, ils notent des problèmes, tels que l'impossibilité dans certains cas d'obtenir toutes les données individuelles des patients et les coûts supplémentaires de traitement de ces données. Ils observent également que pour les modèles simples où les statistiques récapitulatives sont disponibles, les résultats seront souvent similaires ou identiques.

Ils observent également la rareté des méta-analyses de patients individuels citant une revue de Simmonds et al (2005). Ils mentionnent également l'article de revue de méta-analyse combinant des données individuelles sur les patients avec des données agrégées par Riley RD, Simmonds et al (2008)

Riley Lambert Abo-Zaid (2010)

Dans cet article, Riley et al décrivent davantage la méta-analyse des données individuelles des participants. Ils soulignent les avantages de la méta-analyse des données individuelles des participants (par exemple, traitement cohérent des données, modélisation des données manquantes, vérification des résultats originaux rapportés, plus d'options d'analyse, etc.)

Stewart et Tierney (2002)

Stewart et Tierney passent en revue les avantages et les inconvénients de la méta-analyse des données de chaque patient en se concentrant particulièrement sur les questions pratiques.

Riley Lambert et al (2007)

Ils décrivent des méthodes de combinaison des données individuelles des patients avec des données agrégées en termes d'approches en une et deux étapes.

Cooper et Patall (2009)

Cooper et Patall ont écrit un article dans le cadre d'un numéro spécial sur la méta-analyse des données individuelles dans Psychological Methods (voir Shrout, 2009 pour un résumé). Cooper et Patall décrivent la synthèse de la recherche comme une étape dans une deuxième phase de transition:

La première transition va de la revue de recherche narrative - dans laquelle des règles opaques d'algèbre cognitive sont utilisées pour synthétiser les résultats des études - à une méta-analyse de [données agrégées]. La deuxième étape implique la transition de la méta-analyse des [données agrégées] à l'accumulation des [données individuelles au niveau des participants].

à suivre...

Les références

Cooper, H. et Patall, EA (2009). Les avantages relatifs de la méta-analyse menée avec les données des participants individuels par rapport aux données agrégées. Méthodes psychologiques, 14 (2), 165–176. doi: 10.1037 / a0015565
Riley, RD, Lambert, PC, Staessen, JA, Wang, J., Gueyffier, F., Thijs, L., et Boutitie, F. (2007). Méta-analyse des résultats continus combinant les données individuelles des patients et les données agrégées. Statistics in Medicine, 27 (11), 1870–1893. doi: 10.1002 / sim.3165 [PDF] (http://www.staessen.net/publications/2006-2010/08-21-P.pdf)
Riley, RD, Lambert, PC et Abo-Zaid, G. (2010). Méta-analyse des données individuelles des participants: justification, conduite et rapport, BMJ, 340, 221.
Riley RD, Simmonds MC, Look MP. (2007) Synthèse des preuves combinant les données individuelles des patients et les données agrégées: une revue systématique a identifié la pratique actuelle et les méthodes possibles. Journal of Clinical Epidemiology, sous presse et vue précoce.
Riley, RD et Steyerberg, EW (2010). Méta ‐ analyse d'un résultat binaire à l'aide de données individuelles des participants et de données agrégées. Méthodes de synthèse de recherche, 1 (1), 2–19. doi: 10.1002 / jrsm.4
Shrout, PE (2009). Vues courtes et longues de l'analyse des données intégratives: commentaires sur les contributions au numéro spécial. Méthodes psychologiques, 14, 177.
Simmonds MC, Higgins JPT, Stewart LA, Tierney JF, Clarke MJ, Thompson SG. (2005). Méta-analyse des données individuelles des patients issues d'essais randomisés: revue des méthodes utilisées dans la pratique. Essais cliniques ; 2: 209-217.
Stewart LA, Clarke MJ. Méthodologie pratique des méta-analyses (aperçus) utilisant des données individuelles mises à jour sur les patients. Groupe de travail Cochrane. Statistiques en médecine 1995; 14: 2057-2079.
Stewart LA, Tierney JF. Vers IPD ou non vers IPD? Avantages et inconvénients des revues systématiques utilisant des données individuelles sur les patients. Eval Health Prof 2002; 25: 76-97.
Sutton, AJ, Kendrick, D. et Coupland, CAC (2008). Méta-analyse des données individuelles et agrégées. Statistics in Medicine, 27 (5), 651–669.

Jeromy Anglim
la source

Excellente réponse, Jeromy! En fait, cela devrait devenir la meilleure réponse ... Voici quelques articles de plus qui manquent dans votre liste.