Est-ce que quelqu'un peut pratiquement expliquer la raison derrière l' impureté de Gini par rapport au gain d'information (basé sur Entropie)? Quelle métrique est préférable d'utiliser dans différents scénarios lors de l'utilisation d'arbres de
Un arbre de décision est un outil d'aide à la décision qui utilise un graphique ou un modèle arborescent de décisions et de leurs conséquences possibles, y compris les résultats d'événements aléatoires, les coûts des ressources et l'utilité. C'est une façon d'afficher un algorithme.
Est-ce que quelqu'un peut pratiquement expliquer la raison derrière l' impureté de Gini par rapport au gain d'information (basé sur Entropie)? Quelle métrique est préférable d'utiliser dans différents scénarios lors de l'utilisation d'arbres de
Je fais quelques problèmes sur une application d'arbre de décision / forêt aléatoire. J'essaie d'adapter un problème comportant à la fois des chiffres et des chaînes (telles que le nom du pays). Maintenant, dans la bibliothèque, scikit-learn prend uniquement des nombres en tant que paramètres, mais...
Je n'étais pas clair sur quelques concepts: XGBoost convertit les apprenants faibles en apprenants forts. Quel est l'avantage de faire cela? Combiner de nombreux apprenants faibles au lieu d'utiliser simplement un seul arbre? Random Forest utilise divers échantillons d'arbre pour créer un arbre....
Récemment, un de mes amis a été demandé si les algorithmes d'arbre de décision sont des algorithmes linéaires ou non linéaires dans une interview. J'ai essayé de chercher des réponses à cette question mais je n'ai trouvé aucune explication satisfaisante. Quelqu'un peut-il répondre et expliquer la...
La fonction de prédiction ci-dessous donne également des valeurs -ve, il ne peut donc pas s'agir de probabilités. param <- list(max.depth = 5, eta = 0.01, objective="binary:logistic",subsample=0.9) bst <- xgboost(param, data = x_mat, label = y_mat,nround = 3000) pred_s <- predict(bst,...
Je crée un corr()df à partir d'un df d'origine. Le corr()df est sorti 70 X 70 et il est impossible de visualiser le heatmap ... sns.heatmap(df). Si j'essaie d'afficher le corr = df.corr(), le tableau ne correspond pas à l'écran et je peux voir toutes les corrélations. Est-ce un moyen d'imprimer...
J'ai deux questions liées aux arbres de décision: Si nous avons un attribut continu, comment choisissons-nous la valeur de fractionnement? Exemple: Âge = (20,29,50,40 ....) Imaginons que nous ayons un attribut continu qui ont des valeurs dans . Comment puis-je écrire un algorithme qui trouve le...
Dans quels cas est-il préférable d'utiliser un arbre de décision et dans d'autres cas un KNN? Pourquoi en utiliser un dans certains cas? Et l'autre dans des cas différents? (En regardant sa fonctionnalité, pas l'algorithme) Quelqu'un a-t-il des explications ou des références à ce...
Je travaille sur un problème de classification. J'ai un ensemble de données contenant un nombre égal de variables catégorielles et de variables continues. Comment saurai-je quelle technique utiliser? entre un arbre de décision et une régression logistique? Est-il juste de supposer que la régression...
Problème 1: Je suis confus par la description de LightGBM concernant la façon dont l'arbre est développé. Ils déclarent: La plupart des algorithmes d'apprentissage de l'arbre de décision développent l'arbre par niveau (profondeur), comme dans l'image suivante: Question 1 : Quels «la plupart» des...
Pour les réseaux de neurones, nous avons le théorème d'approximation universel qui stipule que les réseaux de neurones peuvent approximer n'importe quelle fonction continue sur un sous-ensemble compact deRnRnR^n. Existe-t-il un résultat similaire pour les arbres à gradient amélioré? Cela semble...
Si je forme mon modèle en utilisant le code suivant: import xgboost as xg params = {'max_depth':3, 'min_child_weight':10, 'learning_rate':0.3, 'subsample':0.5, 'colsample_bytree':0.6, 'obj':'reg:linear', 'n_estimators':1000, 'eta':0.3} features = df[feature_columns] target = df[target_columns]...
Je travaille avec un ensemble de données avec un grand nombre de caractéristiques catégorielles (> 80%) prédisant une variable cible continue (c.-à-d. Régression). J'ai lu pas mal de choses sur la façon de gérer les fonctionnalités catégorielles. Et j'ai appris que l'encodage à chaud que...
Supposons que j'ai une fonction lisse comme . J'ai un ensemble d'entraînement D \ subsetneq \ {((x, y), f (x, y)) | (x, y) \ in \ mathbb {R} ^ 2 \} et, bien sûr, je ne connais pas f bien que je puisse évaluer f où je veux.f(x,y)=x2+y2f(x,y)=x2+y2f(x, y) =
J'ai un ensemble de données qui a un attribut de classe binaire. Il y a 623 instances de classe +1 (cancer positif) et 101 671 instances de classe -1 (cancer négatif). J'ai essayé divers algorithmes (Naive Bayes, Random Forest, AODE, C4.5) et tous ont des taux de faux négatifs inacceptables. Random...
J'ai deux tenseur a:[batch_size, dim] b:[batch_size, dim]. Je veux faire un produit intérieur pour chaque paire du lot, en générant c:[batch_size, 1], où c[i,0]=a[i,:].T*b[i,:].
J'analysais le classificateur créé à l'aide d'un arbre de décision. Il y a un paramètre de réglage appelé max_depth dans l'arbre de décision de scikit. Est-ce l'équivalent de l'élagage d'un arbre de décision? Sinon, comment pourrais-je tailler un arbre de décision à l'aide de scikit? dt_ap =...
J'ai un ensemble de données avec 20000 échantillons, chacun a 12 fonctionnalités différentes. Chaque échantillon appartient à la catégorie 0 ou 1. Je souhaite former un réseau de neurones et une forêt de décision pour catégoriser les échantillons afin de pouvoir comparer les résultats et les deux...
J'ai lu l' explication de la convolution et je la comprends dans une certaine mesure. Quelqu'un peut-il m'aider à comprendre comment cette opération est liée à la convolution dans les réseaux neuronaux convolutionnels? Le filtre est-il une fonction gqui applique du
Fermé . Cette question doit être plus ciblée . Il n'accepte pas actuellement de réponses. Voulez-vous améliorer cette question? Mettez à jour la question pour qu'elle se concentre sur un seul problème en modifiant ce post . Fermé il y a 4 ans . Je travaille sur un projet et j'ai du mal à décider...