Quelles sont les méthodes utilisées par les algorithmes d'apprentissage de l'arbre de décision pour gérer les valeurs manquantes.
Remplissent-ils simplement l'emplacement en utilisant une valeur appelée manquante?
Merci.
la source
Quelles sont les méthodes utilisées par les algorithmes d'apprentissage de l'arbre de décision pour gérer les valeurs manquantes.
Remplissent-ils simplement l'emplacement en utilisant une valeur appelée manquante?
Merci.
Il existe plusieurs méthodes utilisées par divers arbres de décision. Ignorer simplement les valeurs manquantes (comme le fait ID3 et d'autres anciens algorithmes) ou traiter les valeurs manquantes comme une autre catégorie (dans le cas d'une fonctionnalité nominale) ne sont pas de véritables manipulations de valeurs manquantes. Cependant, ces approches ont été utilisées aux premiers stades du développement de l'arbre de décision.
Les approches de gestion réelle des données manquantes n'utilisent pas de point de données avec des valeurs manquantes dans l'évaluation d'une division. Cependant, lorsque des nœuds enfants sont créés et formés, ces instances sont distribuées d'une manière ou d'une autre.
Je connais les approches suivantes pour distribuer les instances de valeur manquantes aux nœuds enfants: