La définition du paramètre min_child_weight dans xgboost est donnée comme:
somme minimale du poids d'instance (toile de jute) nécessaire chez un enfant. Si l'étape de partition d'arborescence aboutit à un nœud feuille avec la somme du poids d'instance inférieure à min_child_weight, le processus de construction abandonnera le partitionnement. En mode de régression linéaire, cela correspond simplement au nombre minimum d'instances nécessaires pour être dans chaque nœud. Plus l'algorithme sera grand et conservateur.
J'ai lu pas mal de choses sur xgboost, y compris le document original (voir la formule 8 et celle juste après l'équation 9), cette question et la plupart des choses à faire avec xgboost qui apparaissent sur les premières pages d'une recherche google. ;)
Fondamentalement, je ne suis toujours pas content de savoir pourquoi nous imposons une contrainte sur la somme de la toile de jute? Ma seule pensée à la minute d'après l'article original est qu'elle se rapporte à la section d'esquisse quantile pondérée (et à la reformulation de l'équation 3 perte quadratique pondérée) qui a comme `` poids '' de chaque instance.
Une autre question concerne pourquoi il s'agit simplement du nombre d'instances en mode de régression linéaire? Je suppose que cela est lié à la dérivée seconde de la somme de l'équation des carrés?
la source