J'ai utilisé l'imputation multiple pour obtenir un certain nombre de jeux de données terminés.
J'ai utilisé des méthodes bayésiennes sur chacun des ensembles de données terminés pour obtenir des distributions postérieures pour un paramètre (un effet aléatoire).
Comment puis-je combiner / regrouper les résultats de ce paramètre?
Plus de contexte:
Mon modèle est hiérarchique dans le sens d'élèves individuels (une observation par élève) regroupés dans les écoles. J'ai effectué plusieurs imputations (en utilisant MICE
dans R) sur mes données où j'ai inclus school
comme l'un des prédicteurs des données manquantes - pour essayer d'incorporer la hiérarchie des données dans les imputations.
J'ai ajusté un modèle de pente aléatoire simple à chacun des ensembles de données terminés (en utilisant MCMCglmm
dans R). Le résultat est binaire.
J'ai trouvé que les densités postérieures de la variance de pente aléatoire sont "bien comportées" dans le sens où elles ressemblent à ceci:
Comment puis-je combiner / regrouper les moyennes postérieures et les intervalles crédibles de chaque ensemble de données imputé, pour cet effet aléatoire?
Update1 :
D'après ce que je comprends jusqu'à présent, je pourrais appliquer les règles de Rubin à la moyenne postérieure, pour donner une moyenne postérieure multipliée imputée - y a-t-il des problèmes avec cela? Mais je ne sais pas comment je peux combiner les intervalles crédibles à 95%. De plus, étant donné que j'ai un véritable échantillon de densité postérieure pour chaque imputation - pourrais-je en quelque sorte les combiner?
Update2 :
Selon la suggestion de @ cyan dans les commentaires, j'aime beaucoup l'idée de simplement combiner les échantillons des distributions postérieures obtenues à partir de chaque ensemble de données complet à partir de l'imputation multiple. Cependant, je voudrais connaître la justification théorique de cette démarche.
la source
Réponses:
Avec des postérieurs particulièrement bien comportés qui peuvent être décrits de manière adéquate par une description paramétrique d'une distribution, vous pourriez peut-être simplement prendre la moyenne et la variance qui décrivent le mieux votre postérieur et partir de là. Je soupçonne que cela peut être adéquat dans de nombreuses circonstances où vous n'obtenez pas de distributions postérieures vraiment étranges.
la source
Si vous utilisez des données, il existe une procédure appelée "mim" qui regroupe les données après imputation à l'aide de modèles à effets mixtes. Je ne sais pas s'il est disponible en R.
la source