Contexte:
Une méta-analyse typique en psychologie pourrait chercher à modéliser la corrélation entre deux variables X et Y. L'analyse impliquerait généralement d'obtenir un ensemble de corrélations pertinentes à partir de la littérature ainsi que la taille des échantillons. Des formules peuvent ensuite être appliquées pour calculer une corrélation moyenne pondérée. Ensuite, des analyses peuvent être effectuées pour voir si les corrélations varient d'une étude à l'autre plus que ne le laisseraient supposer les simples effets d'un échantillonnage aléatoire.
De plus, les analyses peuvent être beaucoup plus complexes. Les estimations peuvent être ajustées pour la fiabilité, la restriction de plage, etc. Les corrélations peuvent être utilisées en combinaison pour explorer la modélisation d'équations méta structurelles ou la méta régression, etc.
Cependant, toutes ces analyses sont effectuées à l'aide de statistiques sommaires (par exemple, corrélations, rapports de cotes, différences moyennes normalisées) comme données d'entrée. Cela nécessite l'utilisation de formules et de procédures spéciales acceptant des statistiques sommaires.
Approche alternative à la méta-analyse
Ainsi, je réfléchissais à une approche alternative à la méta-analyse, où les données brutes sont utilisées en entrée. C'est-à-dire que pour une corrélation, les données d'entrée seraient les données brutes utilisées pour former la corrélation. De toute évidence, dans la plupart des méta-analyses, plusieurs sinon la plupart des données brutes réelles ne sont pas disponibles. Ainsi, une procédure de base pourrait ressembler à ceci:
- Contactez tous les auteurs publiés à la recherche de données brutes et, le cas échéant, utilisez des données brutes réelles .
- Pour les auteurs qui ne fournissent pas de données brutes, simulez les données brutes afin qu'elles aient des statistiques récapitulatives identiques à celles rapportées. Ces simulations pourraient également incorporer toute connaissance acquise à partir des données brutes (par exemple, si une variable est connue pour être biaisée, etc.).
Il me semble qu'une telle approche pourrait avoir plusieurs avantages:
- Des outils statistiques qui utilisent des données brutes en entrée pourraient être utilisés pour des analyses
- En obtenant au moins des données brutes réelles, les auteurs de méta-analyses seraient obligés de prendre en compte les problèmes liés aux données réelles (par exemple, valeurs aberrantes, distributions, etc.).
Question
- Existe-t-il des problèmes avec la réalisation d'études de méta-analyse sur une combinaison de vraies données brutes et de données simulées pour avoir des statistiques sommaires identiques aux études publiées existantes?
- Une telle approche serait-elle supérieure aux méthodes existantes pour effectuer des méta-analyses sur des statistiques sommaires?
- Existe-t-il une documentation existante discutant, préconisant ou critiquant cette approche?
la source
Réponses:
Il existe déjà des approches qui visent à synthétiser les données individuelles et agrégées des personnes. Les Sutton et al. (2008), l'article applique une approche bayésienne qui (à mon humble avis) présente certaines similitudes avec votre idée.
Riley, RD, Lambert, PC, Staessen, JA, Wang, J., Gueyffier, F., Thijs, L., et Boutitie, F. (2007). Méta-analyse des résultats continus combinant les données individuelles des patients et les données agrégées. Statistics in Medicine, 27 (11), 1870–1893. doi: 10.1002 / sim.3165 PDF
Riley, RD et Steyerberg, EW (2010). Méta ‐ analyse d'un résultat binaire à l'aide de données individuelles des participants et de données agrégées. Méthodes de synthèse de recherche, 1 (1), 2–19. doi: 10.1002 / jrsm.4
Sutton, AJ, Kendrick, D. et Coupland, CAC (2008). Méta-analyse des données individuelles et agrégées. Statistics in Medicine, 27 (5), 651–669.
la source
Je remercie @Bernd de m'avoir indiqué dans la bonne direction. Voici quelques notes sur les références qu'il a mentionnées dans sa réponse, ainsi que certaines des références mentionnées dans ces articles.
Sutton et al (2008)
Sutton et al utilisent dans un contexte de santé les termes données individuelles des patients par rapport aux données agrégées .
Ils notent que l'analyse des données individuelles des patients est souvent considérée comme l'étalon-or pour la méta-analyse, citant Stewart et Clark (1995). Il est particulièrement utile pour évaluer la qualité des données et effectuer des analyses sur des valeurs non déclarées dans les rapports existants (par exemple, des analyses de sous-groupes particuliers). Naturellement, ils notent des problèmes, tels que l'impossibilité dans certains cas d'obtenir toutes les données individuelles des patients et les coûts supplémentaires de traitement de ces données. Ils observent également que pour les modèles simples où les statistiques récapitulatives sont disponibles, les résultats seront souvent similaires ou identiques.
Ils observent également la rareté des méta-analyses de patients individuels citant une revue de Simmonds et al (2005). Ils mentionnent également l'article de revue de méta-analyse combinant des données individuelles sur les patients avec des données agrégées par Riley RD, Simmonds et al (2008)
Riley Lambert Abo-Zaid (2010)
Dans cet article, Riley et al décrivent davantage la méta-analyse des données individuelles des participants. Ils soulignent les avantages de la méta-analyse des données individuelles des participants (par exemple, traitement cohérent des données, modélisation des données manquantes, vérification des résultats originaux rapportés, plus d'options d'analyse, etc.)
Stewart et Tierney (2002)
Stewart et Tierney passent en revue les avantages et les inconvénients de la méta-analyse des données de chaque patient en se concentrant particulièrement sur les questions pratiques.
Riley Lambert et al (2007)
Ils décrivent des méthodes de combinaison des données individuelles des patients avec des données agrégées en termes d'approches en une et deux étapes.
Cooper et Patall (2009)
Cooper et Patall ont écrit un article dans le cadre d'un numéro spécial sur la méta-analyse des données individuelles dans Psychological Methods (voir Shrout, 2009 pour un résumé). Cooper et Patall décrivent la synthèse de la recherche comme une étape dans une deuxième phase de transition:
à suivre...
Les références
la source