Supposons que l'on ait deux échantillons indépendants de la même population et que des méthodes différentes ont été utilisées sur les deux échantillons pour dériver l'estimation ponctuelle et les intervalles de confiance. Dans des cas triviaux, une personne sensée regrouperait simplement les deux échantillons et utiliserait une seule méthode pour effectuer l'analyse, mais supposons pour le moment qu'une méthode différente doit être utilisée en raison de la limitation de l'un des échantillons, comme les données manquantes. Ces deux analyses distinctes généreraient des estimations indépendantes tout aussi valables pour l'attribut de population d'intérêt. Intuitivement, je pense qu'il devrait y avoir un moyen de combiner correctement ces deux estimations, à la fois en termes d'estimation ponctuelle et d'intervalle de confiance, résultant en une meilleure procédure d'estimation. Ma question est quelle devrait être la meilleure façon de le faire? Je peux imaginer une moyenne pondérée d'une sorte en fonction des informations / taille de l'échantillon dans chaque échantillon, mais qu'en est-il des intervalles de confiance?
la source
Cela ressemble beaucoup à une méta-analyse pour moi. Votre hypothèse selon laquelle les échantillons proviennent de la même population signifie que vous pouvez utiliser une méta-analyse à effets fixes (plutôt qu'une méta-analyse à effets aléatoires). La méthode générique de variance inverse prend un ensemble d'estimations indépendantes et leurs variances en entrée, elle ne nécessite donc pas les données complètes et fonctionne même si différents estimateurs ont été utilisés pour différents échantillons. L'estimation combinée est alors une moyenne pondérée des estimations distinctes, pondérant chaque estimation par l'inverse de sa variance. La variance de l'estimation combinée est l'inverse de la somme des poids (les inverses des variances).
Vous voulez travailler sur une échelle où la distribution d'échantillonnage de l'estimation est approximativement normale, ou au moins une échelle sur laquelle les intervalles de confiance sont approximativement symétriques, donc une échelle transformée en logarithme est habituelle pour les estimations de ratios (ratios de risque, odds ratios, taux ratios ...). Dans d'autres cas, une transformation stabilisant la variance serait utile, par exemple une transformation racine carrée pour les données de Poisson, une transformation arcsin-racine carrée pour les données binomiales, etc.
la source
Ce n'est pas différent d'un échantillon stratifié. Ainsi, la mise en commun des échantillons pour une estimation ponctuelle et une erreur standard semble être une approche raisonnable. Les deux échantillons seraient pondérés selon la proportion de l'échantillon.
la source
Voir l'article: KM Scott, X. Lu, CM Cavanaugh, JS Liu, Optimal methods for estimation cinetic isotope effects from different formes of the Rayleigh distillation equation, Geochimica et Cosmochimica Acta, Volume 68, Issue 3, 1 February 2004, Pages 433- 442, ISSN 0016-7037, http://dx.doi.org/10.1016/S0016-7037(03)00459-9 . ( http://www.sciencedirect.com/science/article/pii/S0016703703004599 )
la source