J'essaie de convertir ma colonne de facteurs en variables factices:
str(cards$pointsBin)
# Factor w/ 5 levels ".lte100",".lte150",..: 3 2 3 1 4 4 2 2 4 4 ...
labels <- model.matrix(~ pointsBin, data=cards)
head(labels)
# (Intercept) pointsBin.lte150 pointsBin.lte200 pointsBin.lte250 pointsBin.lte300
# 741 1 0 0 0 0
# 407 1 1 0 0 0
# 676 1 0 0 1 0
# 697 1 1 0 0 0
# 422 1 0 1 0 0
# 300 1 0 1 0 0
Il n'y a pas de colonne pour la première valeur de mon facteur ( ".lte100"
), qui correspond à la première ligne à classer. Comment récupérer ces données? Et que signifie la colonne Interception qui semble être tous les 1?
r
categorical-data
categorical-encoding
digitgopher
la source
la source
- 1
lorsque vous avez un seul prédicteur catégorique représenté comme un facteur (comme dans cette question), cela supposera que vous ne voulez pas vraiment dire cela et que vous passerez à l'utilisation de sum- codage à zéro; ce qui est bien sûr juste un paramétrage différent. Trop sympathique, si vous me demandez.Réponses:
Considérer ce qui suit:
Les deux premières commandes sont identiques. Les deux dernières commandes spécifient de ne pas produire l'interception et conserve les deux variables fictives produites.
la source