J'exécute une classification d'arbre de décision en utilisant SPSS sur un ensemble de données avec environ 20 prédicteurs (catégorique avec quelques catégories). CHAID (Détection automatique d'interaction chi carré) et CRT / CART (Arbres de classification et de régression) me donnent des arbres différents. Quelqu'un peut-il expliquer les mérites relatifs de CHAID vs CRT? Quelles sont les implications de l'utilisation d'une méthode par rapport à l'autre?
23
Toutes les méthodes à arbre unique impliquent un nombre stupéfiant de comparaisons multiples qui apportent une grande instabilité au résultat. C'est pourquoi, pour obtenir une discrimination prédictive satisfaisante, une certaine forme de moyennage des arbres (ensachage, renforcement, forêts aléatoires) est nécessaire (sauf que vous perdez l'avantage des arbres - interprétabilité). La simplicité des arbres isolés est largement une illusion. Ils sont simples parce qu'ils ont tort en ce sens que la formation de l'arbre à plusieurs grands sous-ensembles de données révélera un grand désaccord entre les structures des arbres.
Je n'ai pas examiné de méthodologie CHAID récente, mais CHAID dans son incarnation originale était un excellent exercice de surinterprétation des données.
la source