Cette question pourrait aller ici ou sur SO peut-être ...
Supposons que votre jeu de données de formation contienne à la fois des données catégorielles et continues telles que cette configuration:
Animal, breed, sex, age, weight, blood_pressure, annual_cost
cat, calico, M, 10, 15 , 100 , 100
cat, tabby, F, 5, 10 , 80 , 200
dog, beagle, M, 3, 30 , 90 , 200
dog, lab, F, 8, 75 , 80 , 100
Et la variable dépendante à prévoir est le coût annuel du vétérinaire. Je suis un peu confus quant aux techniques spécifiques disponibles pour traiter un tel ensemble de données. Quelles sont les méthodes couramment utilisées pour traiter les ensembles de données qui sont un mélange de données continues et catégorielles?
la source
Vous devriez jeter un œil au prétraitement des données . C'est avant toute technique d'apprentissage automatique. Voici une bonne introduction (trouvée sur Google).
En ce qui concerne les techniques, il existe de nombreuses approches différentes . Vous pouvez probablement utiliser la plupart d'entre eux après avoir prétraité vos données. Vous devriez les essayer et choisir celui qui correspond le mieux à vos besoins.
la source