Questions marquées «data-imputation»

Fait référence à une classe générale de méthodes utilisées pour «remplir» les données manquantes. Les méthodes utilisées pour ce faire sont généralement liées à l'interpolation (http://en.wikipedia.org/wiki/Interpolation) et nécessitent des hypothèses sur les raisons pour lesquelles les données sont manquantes (par exemple "manquant au hasard")

78
Un exemple: régression LASSO utilisant glmnet pour les résultats binaires

Je commence à me familiariser avec l’utilisation de glmnetavec LASSO Regression, où mon résultat d’intérêt est dichotomique. J'ai créé un petit cadre de données fictif ci-dessous: age <- c(4, 8, 7, 12, 6, 9, 10, 14, 7) gender <- c(1, 0, 1, 1, 1, 0, 1, 0, 0) bmi_p <- c(0.86, 0.45, 0.99,...

26
R caret et NAs

Je préfère de beaucoup le caret pour sa capacité de réglage des paramètres et son interface uniforme, mais j'ai observé qu'il nécessite toujours des ensembles de données complets (c'est-à-dire sans NA) même si le modèle "nu" appliqué autorise les NA. C'est très gênant, car il faut appliquer des...

23
Imputation des valeurs manquantes pour l'ACP

J'ai utilisé la prcomp()fonction pour effectuer une PCA (analyse des composants principaux) dans R. Cependant, il y a un bogue dans cette fonction, de sorte que le na.actionparamètre ne fonctionne pas. J'ai demandé de l'aide sur stackoverflow ; deux utilisateurs y ont proposé deux manières...

20
Comment combiner des intervalles de confiance pour une composante de variance d'un modèle à effets mixtes lors de l'utilisation de l'imputation multiple

La logique de l'imputation multiple (MI) consiste à imputer les valeurs manquantes non pas une fois mais plusieurs (généralement M = 5), ce qui donne M ensembles de données terminés. Les M ensembles de données complétés sont ensuite analysés avec des méthodes de données complètes sur lesquelles les...

14
Packages d'imputation KNN R

Je recherche un package d'imputation KNN. J'ai regardé le paquet d'imputation ( http://cran.r-project.org/web/packages/imputation/imputation.pdf ) mais pour une raison quelconque, la fonction d'imputation KNN (même en suivant l'exemple de la description) semble seulement pour imputer des valeurs...

12
Comment effectuer l'imputation de valeurs dans un très grand nombre de points de données?

J'ai un très grand ensemble de données et il manque environ 5% de valeurs aléatoires. Ces variables sont corrélées entre elles. L'exemple de jeu de données R suivant n'est qu'un exemple de jouet avec des données corrélées factices. set.seed(123) # matrix of X variable xmat <- matrix(sample(-1:1,...

9
Imputation d'une variable censurée

J'ai un ensemble de données médicales avec environ 200 variables. L'une des variables est un bio-marqueur (concentration d'une enzyme particulière). Sa distribution est asymétrique, et le problème est que les valeurs au-dessus d'un certain niveau sont censurées / coupées à ce niveau. Ainsi, alors...