J'utilise caret pour exécuter une forêt aléatoire validée de façon croisée sur un ensemble de données. La variable Y est un facteur. Il n'y a pas de NaN, Inf ou NA dans mon jeu de données. Cependant, lors de l'exécution de la forêt aléatoire, j'obtiens
Error in randomForest.default(m, y, ...) :
NA/NaN/Inf in foreign function call (arg 1)
In addition: There were 28 warnings (use warnings() to see them)
Warning messages:
1: In data.matrix(x) : NAs introduced by coercion
2: In data.matrix(x) : NAs introduced by coercion
3: In data.matrix(x) : NAs introduced by coercion
4: In data.matrix(x) : NAs introduced by coercion
Quelqu'un a-t-il des idées pour savoir si cette erreur est causée par les AN introduits par la contrainte? Si oui, comment puis-je empêcher une telle coercition?
r
random-forest
caret
regression
prediction
fitting
social-science
poisson-distribution
distributions
characteristic-function
bayesian
prior
regression
normal-distribution
interaction
nonparametric
skewness
svm
standard-deviation
standard-error
regression-coefficients
igraph
natural-language
word2vec
word-embeddings
regression
machine-learning
sampling
r
regression
machine-learning
random-forest
ensemble
sampling
unbiased-estimator
proof
estimators
mse
probability
conditional-probability
bayes
anova
missing-data
neural-networks
recommender-system
r
confidence-interval
sample
multiple-imputation
r
time-series
forecasting
mase
Info5ek
la source
la source
La cause est probablement que vous avez des variables de caractère dans votre bloc de données.
Convertissez toutes les variables de caractère en facteur sur une seule ligne:
library(dplyr) data_fac=data_char %>% mutate_if(is.character, as.factor)
la source
mutate_if()
pour ça ... merci!Comme indiqué dans l'avertissement, il y avait 28 erreurs qui se trouvaient être le nombre de colonnes avec des types de données de caractères ("chr"). Forcer ces colonnes à des facteurs a permis au cycle de commencer.
la source