En étudiant les méthodes d'exploration de données, j'ai compris qu'il existe deux catégories principales:
Méthodes prédictives:
- Classification
- Régression
Méthodes descriptives:
- Regroupement
- Règles d'association
Comme je veux prédire la disponibilité de l'utilisateur (sortie) en fonction de l'emplacement, de l'activité, du niveau de la batterie (entrée pour le modèle de formation), je pense qu'il est évident que je choisirais des "méthodes prédictives", mais maintenant je n'arrive pas à choisir entre classification et régression. D'après ce que je comprends jusqu'à présent, la classification peut résoudre mon problème, car la sortie est "disponible" ou "non disponible".
La classification peut-elle me fournir la probabilité (ou la probabilité) que l'utilisateur soit disponible ou non?
Comme dans la sortie, ce ne serait pas seulement 0 (non disponible) ou 1 (pour disponible), mais ce serait quelque chose comme:
- disponible
- non disponible
Ce problème peut-il également être résolu en utilisant la régression?
Vous pouvez utiliser la classification bayésienne naïve et calculer les probabilités postérieures à l'aide de croyances antérieures ou la régression logistique peut être utilisée avec la fonction sigmoïde.
la source