Supposons que nous ayons une réponse Y et des prédicteurs X1, ...., Xn. Si nous devions essayer d'ajuster Y via un modèle linéaire de X1, ...., Xn, et il se trouve que la vraie relation entre Y et X1, ..., Xn n'était pas linéaire, nous pourrions être en mesure pour fixer le modèle en transformant les X en quelque sorte, puis en ajustant le modèle. De plus, s'il arrivait que X1, ..., XN n'affecte pas y indépendamment des autres fonctionnalités, nous pourrions également être en mesure d'améliorer le modèle en incluant des termes d'interaction, x1 * x3 ou x1 * x4 * x7 ou quelque chose de similaire. Ainsi, dans le cas linéaire, les termes d'interaction peuvent apporter de la valeur en corrigeant les violations de non-linéarité ou d'indépendance entre la réponse et les caractéristiques.
Cependant, Random Forests ne fait pas vraiment ces hypothèses. L'inclusion de termes d'interaction est-elle importante lors de l'ajustement d'une forêt aléatoire? Ou l'inclusion des termes individuels et le choix des paramètres appropriés permettront-ils aux forêts aléatoires de saisir ces relations?