Presque chaque exemple d'arbre de décision que j'ai rencontré se trouve être un arbre binaire. Est-ce à peu près universel? La plupart des algorithmes standard (C4.5, CART, etc.) prennent-ils uniquement en charge les arbres binaires? D'après ce que je comprends, CHAID n'est pas limité aux arbres binaires, mais cela semble être une exception.
Une séparation bidirectionnelle suivie d'une autre séparation bidirectionnelle sur l'un des enfants n'est pas la même chose qu'une séparation triple unique. Cela peut être un point académique, mais j'essaie de m'assurer de comprendre les cas d'utilisation les plus courants.
la source
Je ne sais pas ce que tu veux dire ici. Tout fractionnement multidirectionnel peut être représenté comme une série de séparations bidirectionnelles. Pour une séparation à trois, vous pouvez diviser en A, B et C en divisant d'abord en A et B contre C, puis en séparant A de B.
Un algorithme donné peut ne pas choisir cette séquence particulière (surtout si, comme la plupart des algorithmes, il est gourmand), mais il le pourrait certainement. Et si des procédures de randomisation ou d'étape sont effectuées comme dans des forêts aléatoires ou des arbres boostés, les chances de trouver la bonne séquence de divisions augmentent. Comme d'autres l'ont souligné, les divisions multi-voies sont coûteuses en termes de calcul, donc étant donné ces alternatives, la plupart des chercheurs semblent avoir choisi des divisions binaires.
J'espère que cela t'aides
la source
En ce qui concerne les utilisations de l'arbre de décision et du fractionnement (binaire ou autre), je ne connais que CHAID qui a des divisions non binaires mais il y en a probablement d'autres. Pour moi, l'utilisation principale d'un fractionnement non binaire est dans les exercices d'exploration de données où je cherche à regrouper de manière optimale une variable nominale à plusieurs niveaux. Une série de divisions binaires n'est pas aussi utile qu'un regroupement effectué par CHAID.
la source
Veuillez lire ceci
la source