Questions marquées «multiple-imputation»

L'imputation multiple fait référence à un ensemble de routines d'imputation stochastique visant à préserver les caractéristiques multivariées des données

29
Comment gérer les données hiérarchiques / imbriquées dans l'apprentissage automatique

Je vais expliquer mon problème avec un exemple. Supposons que vous souhaitiez prédire le revenu d'un individu en fonction de certains attributs: {âge, sexe, pays, région, ville}. Vous avez un ensemble de données de formation comme ça train <- data.frame(CountryID=c(1,1,1,1, 2,2,2,2, 3,3,3,3),...

29
R: Random Forest lançant NaN / Inf dans l'erreur «appel de fonction étrangère» malgré l'absence de NaN dans l'ensemble de données [fermé]

Fermé. Cette question est hors sujet . Il n'accepte pas actuellement de réponses. Voulez-vous améliorer cette question? Mettez à jour la question afin qu'elle soit sur le sujet pour la validation croisée. Fermé il y a 2 ans . J'utilise caret pour exécuter une forêt aléatoire validée de façon...

12
Comment effectuer l'imputation de valeurs dans un très grand nombre de points de données?

J'ai un très grand ensemble de données et il manque environ 5% de valeurs aléatoires. Ces variables sont corrélées entre elles. L'exemple de jeu de données R suivant n'est qu'un exemple de jouet avec des données corrélées factices. set.seed(123) # matrix of X variable xmat <- matrix(sample(-1:1,...

10
lmer avec multiplier les données imputées

Comment puis-je obtenir des effets aléatoires groupés pour lmer après une imputation multiple? J'utilise des souris pour imputer plusieurs trames de données. Et lme4 pour un modèle mixte avec interception aléatoire et pente aléatoire. La mise en commun de lmer se passe bien, sauf qu'elle ne...

8
Test post-hoc après mesures répétées à 2 facteurs ANOVA dans R?

J'ai des problèmes à trouver une solution concernant la façon d'exécuter un test post-hoc (Tukey HSD) après une ANOVA à mesures répétées à 2 facteurs (tous deux intra-sujets) en R. Pour l'ANOVA, j'ai utilisé la fonction aov: summary(aov(dv ~ x1 * x2 + Error(subject/(x1*x2)), data=df1)) Après avoir...