En faisant des recherches sur l'algorithme xgboost, j'ai parcouru la documentation .
Dans cette approche, les arbres sont régularisés en utilisant la définition de la complexité
Je me demande: comment cela définit-il la complexité? , le nombre de nœuds terminaux, me semble naturel. Mais la somme des scores finaux au carré?
Peut-être que le sur-ajustement est signifié. Cela signifie que des scores très élevés donnent trop de confiance? Est-il choisi pour obtenir un apprenant faible? Quelle est l'explication naturelle de ce choix de la fonction de complexité?