J'ai besoin d'analyser avec R les données d'une enquête médicale (avec plus de 100 colonnes codées) qui vient dans un CSV. Je vais utiliser le hochet pour une première analyse mais en coulisses c'est toujours R.
Si je lis.csv () le fichier, les colonnes avec des codes numériques sont traitées comme des données numériques. Je suis conscient que je pourrais créer des colonnes catégorielles à partir d'eux avec factor (), mais le faire pour plus de 100 colonnes est pénible.
J'espère qu'il existe une meilleure façon de dire à R d'importer les colonnes directement en tant que facteurs. Ou au moins pour les convertir en place par la suite.
Je vous remercie!
r
categorical-data
data-transformation
wishihadabettername
la source
la source
Réponses:
Vous pouvez utiliser l'
colClasses
argument pour spécifier les classes de vos colonnes de données. Par exemple:affectera un chiffre à la première colonne, un facteur aux deuxième et troisième. Étant donné que vous avez autant de colonnes, un raccourci peut être:
ou une telle variation (c.-à-d. attribuer un chiffre à la première colonne, un facteur aux 37 colonnes suivantes, puis un caractère à la dernière).
la source
ou faites-le simplement après avoir lu les données
bien que ce type de Q soit probablement plus adapté à Stack Overflow.modifier : voir ci-dessous.
la source
'T'
et'F'
(est converti en logique).