Les forêts de décision et les forêts aléatoires sont-elles la même chose?

8

Sur la base d'une réponse sur la validation croisée, j'ai cherché à implémenter une forêt aléatoire en .NET / C # pour classer les documents de texte.

En parcourant le Web pour voir s'il existe des implémentations existantes, je suis tombé sur un algorithme pour une forêt de décision sur Alglib .

Le truc c'est que je n'arrive pas à trouver quelque chose de spécifique à la "forêt de décision" n'importe où (c'est ambigu même ici ), c'est typiquement mélangé avec une forêt aléatoire.

Cela dit, les deux sont-ils identiques, simplement référencés différemment, ou y a-t-il des différences inhérentes entre les deux?

casperOne
la source

Réponses:

13

Sur la page d'Alglib que vous avez citée, il est écrit:

"L'algorithme RDF [Random decision forest] est une modification de l'algorithme original Random Forest conçu par Leo Breiman et Adele Cutler."

Une question sur rapid-i.com fait référence à

Ho TK (1998) The Random Subspace Method for Constructing Decision Forests. IEEE Trans Pattern Anal Mach Intel 20 (8) 832-844 [ Résumé ]

ce qui pourrait être encore une autre chose.

Sur la page Web de Breiman à Berkeley , il est écrit:

"Random Forests (tm) est une marque déposée de Leo Breiman et Adele Cutler et est concédée sous licence exclusive à Salford Systems pour la sortie commerciale du logiciel. Nos marques incluent également RF (tm), RandomForests (tm), RandomForest (tm) et Random Forêt (tm). "

Je conclus donc qu'il existe de subtiles différences, mais c'est surtout un problème de marque concernant le nom de "forêt aléatoire".

Karl
la source