Combinaison de deux intervalles de confiance / estimations ponctuelles

17

Supposons que l'on ait deux échantillons indépendants de la même population et que des méthodes différentes ont été utilisées sur les deux échantillons pour dériver l'estimation ponctuelle et les intervalles de confiance. Dans des cas triviaux, une personne sensée regrouperait simplement les deux échantillons et utiliserait une seule méthode pour effectuer l'analyse, mais supposons pour le moment qu'une méthode différente doit être utilisée en raison de la limitation de l'un des échantillons, comme les données manquantes. Ces deux analyses distinctes généreraient des estimations indépendantes tout aussi valables pour l'attribut de population d'intérêt. Intuitivement, je pense qu'il devrait y avoir un moyen de combiner correctement ces deux estimations, à la fois en termes d'estimation ponctuelle et d'intervalle de confiance, résultant en une meilleure procédure d'estimation. Ma question est quelle devrait être la meilleure façon de le faire? Je peux imaginer une moyenne pondérée d'une sorte en fonction des informations / taille de l'échantillon dans chaque échantillon, mais qu'en est-il des intervalles de confiance?

user1600
la source

Réponses:

9

Vous pouvez faire une estimation groupée comme suit. Vous pouvez ensuite utiliser les estimations groupées pour générer un intervalle de confiance combiné. Plus précisément, laissez:

x1¯N(μ,σ2n1)

x2¯N(μ,σ2n2)

En utilisant les intervalles de confiance pour les deux cas, vous pouvez reconstruire les erreurs-types pour les estimations et remplacer ce qui précède par:

x1¯N(μ,SE1)

x2¯N(μ,SE2)

Une estimation groupée serait:

x¯=n1x1¯+n2x2¯n1+n2

Donc,

x¯N(μ,n12SE1+n22SE2(n1+n2)2)=N(μ,σ2n1+n2)

Communauté
la source
1
β^±ZαSE
@ user1600 Bon point.
Cette réponse pourrait être appliquée à deux distributions quelconques, c'est juste que le produit des normales est une normale, donnant une belle solution. La simulation MCMC pourrait être utilisée avec des paires de distributions sans solution sous forme fermée, en utilisant une approche bayésienne avec un échantillon étant le précédent et l'autre la probabilité.
David LeBauer
Si l'on revient aux intervalles de confiance de la SE regroupée, quels seraient les degrés de liberté pour la distribution T? Cela changerait-il si l'on combinait plus de 2 intervalles de confiance?
DocBuckets
3

Cela ressemble beaucoup à une méta-analyse pour moi. Votre hypothèse selon laquelle les échantillons proviennent de la même population signifie que vous pouvez utiliser une méta-analyse à effets fixes (plutôt qu'une méta-analyse à effets aléatoires). La méthode générique de variance inverse prend un ensemble d'estimations indépendantes et leurs variances en entrée, elle ne nécessite donc pas les données complètes et fonctionne même si différents estimateurs ont été utilisés pour différents échantillons. L'estimation combinée est alors une moyenne pondérée des estimations distinctes, pondérant chaque estimation par l'inverse de sa variance. La variance de l'estimation combinée est l'inverse de la somme des poids (les inverses des variances).

Vous voulez travailler sur une échelle où la distribution d'échantillonnage de l'estimation est approximativement normale, ou au moins une échelle sur laquelle les intervalles de confiance sont approximativement symétriques, donc une échelle transformée en logarithme est habituelle pour les estimations de ratios (ratios de risque, odds ratios, taux ratios ...). Dans d'autres cas, une transformation stabilisant la variance serait utile, par exemple une transformation racine carrée pour les données de Poisson, une transformation arcsin-racine carrée pour les données binomiales, etc.

un arrêt
la source
1

Ce n'est pas différent d'un échantillon stratifié. Ainsi, la mise en commun des échantillons pour une estimation ponctuelle et une erreur standard semble être une approche raisonnable. Les deux échantillons seraient pondérés selon la proportion de l'échantillon.

Brett
la source