En utilisant Amelia dans R, j'ai obtenu plusieurs jeux de données imputés. Après cela, j'ai effectué un test de mesures répétées dans SPSS. Maintenant, je veux regrouper les résultats des tests. Je sais que je peux utiliser les règles de Rubin (implémentées via n'importe quel package d'imputation multiple dans R) pour regrouper les moyennes et les erreurs standard, mais comment regrouper les valeurs p? C'est possible? Y a-t-il une fonction dans R pour le faire? Merci d'avance.
11
Réponses:
Oui , c'est possible et, oui, il y a des
R
fonctions qui le font. Au lieu de calculer manuellement les valeurs de p des analyses répétées, vous pouvez utiliser le packageZelig
, qui est également mentionné dans la vignette duAmelia
-package ( pour une méthode plus informative, voir ma mise à jour ci-dessous ). Je vais utiliser un exemple de laAmelia
-vignette pour le démontrer:Il s'agit de la sortie correspondante, y compris les valeurs :p
zelig
peut s'adapter à une multitude de modèles autres que les moindres carrés.Pour obtenir des intervalles de confiance et des degrés de liberté pour vos estimations, vous pouvez utiliser
mitools
:Cela vous donnera des intervalles de confiance et une proportion de la variance totale attribuable aux données manquantes:
Bien sûr, vous pouvez simplement combiner les résultats intéressants en un seul objet:
Mise à jour
Après avoir joué, j'ai trouvé un moyen plus flexible d'obtenir toutes les informations nécessaires en utilisant le
mice
paquet. Pour que cela fonctionne, vous devrez modifier la fonction du packageas.mids()
. Utilisez la version de Gerko publiée dans ma question de suivi :Une fois ceci défini, vous pouvez continuer à analyser les ensembles de données imputées:
Cela vous donnera tous les résultats que vous obtenez en utilisant
Zelig
etmitools
en plus:Remarque: en utilisant,p réF R2
pool()
vous pouvez également calculer les valeurs de avec ajusté pour les petits échantillons en omettant le paramètre-. Ce qui est encore mieux, vous pouvez désormais également calculer et comparer les modèles imbriqués:method
la source
mice.res <- summary(pool(mice.fit, method = "rubin1987"))
.Normalement, vous prendriez la valeur de p en appliquant les règles de Rubin sur les paramètres statistiques conventionnels comme les poids de régression. Ainsi, il n'est souvent pas nécessaire de regrouper les valeurs p directement. De plus, la statistique du rapport de vraisemblance peut être regroupée pour comparer les modèles. Les procédures de mise en commun d'autres statistiques se trouvent dans mon livre Flexible Imputation of Missing Data, chapitre 6.
Dans les cas où il n'y a pas de distribution ou de méthode connue, il existe une procédure non publiée par Licht et Rubin pour les tests unilatéraux. J'ai utilisé cette procédure pour regrouper les valeurs p de la
wilcoxon()
procédure, mais il est général et simple de s'adapter à d'autres utilisations.Utilisez la procédure ci-dessous UNIQUEMENT si tout le reste échoue, car pour l'instant, nous savons peu de choses sur ses propriétés statistiques.
la source
pool()
fonction de votre package (qui est excellente d'ailleurs) arrive-t-elle à la valeur p groupée?