Questions marquées «ensemble»

245

Mise en sac, boost et empilement dans l'apprentissage automatique

Quelles sont les similitudes et les différences entre ces 3 méthodes: Ensachage, Boosting, Empiler? Quel est le meilleur? Et pourquoi? Pouvez-vous me donner un exemple pour

110

Arbre de renforcement dégradé vs forêt aléatoire

Comme l’a proposé Friedman, l’amélioration des arbres en dégradé utilise des arbres de décision comme apprenants de base. Je me demande si nous devrions rendre l'arbre de décision de base aussi complexe que possible (complètement développé) ou plus simple? Y a-t-il une explication au choix? Random...

machine-learning random-forest cart boosting ensemble

108

Résultats des élections américaines 2016: qu'est-ce qui n'allait pas avec les modèles de prédiction?

D'abord c'était le Brexit , maintenant les élections américaines. De nombreuses prédictions de modèles ont été largement décalées et reste-t-il des leçons à tirer ici? Pas plus tard qu'hier, à 16 heures, heure de Paris, les marchés des paris étaient toujours favorables à Hillary 4 à 1. Je suppose...

predictive-models ensemble confounding

35

Augmentation de gradient pour la régression linéaire - pourquoi cela ne fonctionne-t-il pas?

Lors de l'apprentissage de Gradient Boosting, je n'ai jamais entendu parler de contraintes concernant les propriétés d'un "classificateur faible" que la méthode utilise pour construire et modéliser un modèle. Cependant, je ne pouvais pas imaginer une application de Go utilisant une régression...

regression machine-learning boosting ensemble gradient

32

Les variables hautement corrélées en forêt aléatoire ne vont-elles pas fausser la précision et la sélection des caractéristiques?

À mon sens, les variables hautement corrélées ne causeront pas de problèmes de multi-colinéarité dans un modèle de forêt aléatoire (corrigez-moi si je me trompe). Toutefois, si j’ai trop de variables contenant des informations similaires, le modèle pèsera-t-il trop sur cet ensemble plutôt que sur...

random-forest multicollinearity ensemble

29

R: Random Forest lançant NaN / Inf dans l'erreur «appel de fonction étrangère» malgré l'absence de NaN dans l'ensemble de données [fermé]

Fermé. Cette question est hors sujet . Il n'accepte pas actuellement de réponses. Voulez-vous améliorer cette question? Mettez à jour la question afin qu'elle soit sur le sujet pour la validation croisée. Fermé il y a 2 ans . J'utilise caret pour exécuter une forêt aléatoire validée de façon...

r random-forest caret regression prediction fitting social-science poisson-distribution distributions characteristic-function bayesian prior regression normal-distribution interaction nonparametric skewness svm standard-deviation standard-error regression-coefficients igraph natural-language word2vec word-embeddings regression machine-learning sampling r regression machine-learning random-forest ensemble sampling unbiased-estimator proof estimators mse probability conditional-probability bayes anova missing-data neural-networks recommender-system r confidence-interval sample multiple-imputation r time-series forecasting mase

27

Ensemble de différents types de régresseurs utilisant scikit-learn (ou tout autre framework python)

J'essaie de résoudre la tâche de régression. J'ai découvert que 3 modèles fonctionnent parfaitement pour différents sous-ensembles de données: LassoLARS, SVR et Gradient Tree Boosting. J'ai remarqué que lorsque je fais des prédictions en utilisant tous ces 3 modèles, puis que je fais un tableau de...

regression scikit-learn ensemble

22

Sur la «force» des apprenants faibles

J'ai plusieurs questions étroitement liées concernant les apprenants faibles dans l'apprentissage d'ensemble (par exemple, le renforcement). Cela peut sembler stupide, mais quels sont les avantages d'utiliser des apprenants faibles plutôt que des apprenants forts? (par exemple, pourquoi ne pas...

machine-learning boosting ensemble

21

Modèles empilables / assemblables avec caret

Je me retrouve souvent à former plusieurs modèles prédictifs différents en utilisant caretR. Je vais tous les former sur les mêmes plis de validation croisée, en utilisant caret::: createFolds, puis en choisissant le meilleur modèle basé sur une erreur de validation croisée. Cependant, la...

r caret ensemble

21

Stimuler les réseaux de neurones

Eh bien récemment, je travaillais sur l'apprentissage d'algorithmes de renforcement, tels que adaboost, gradient boost, et je savais que le plus faible apprenant utilisé était les arbres. Je veux vraiment savoir s'il existe des exemples récents de succès (je veux dire des articles ou des articles)...

neural-networks deep-learning boosting ensemble dropout

20

Combiner des modèles d'apprentissage automatique

Je suis un peu nouveau dans le datamining / machine learning / etc. et j'ai lu quelques façons de combiner plusieurs modèles et exécutions du même modèle pour améliorer les prévisions. Mon impression de la lecture de quelques articles (qui sont souvent intéressants et excellents sur la théorie et...

r random-forest k-nearest-neighbour ensemble

20

k-fold Validation croisée de l'apprentissage d'ensemble

Je suis confus sur la façon de partitionner les données pour la validation croisée k-fold de l'apprentissage d'ensemble. En supposant que j'ai un cadre d'apprentissage d'ensemble pour la classification. Ma première couche contient les modèles de classification, par exemple svm, les arbres de...

classification cross-validation ensemble

17

Quand ne devrais-je pas utiliser un classificateur d'ensemble?

En général, dans un problème de classification où le but est de prédire avec précision l'appartenance à une classe hors échantillon, quand ne devrais-je pas utiliser un classificateur d'ensemble? Cette question est étroitement liée à Pourquoi ne pas toujours utiliser l'apprentissage d'ensemble? ....

classification boosting ensemble bagging

16

Comment les méthodes d'ensemble surpassent-elles toutes leurs composantes?

Je suis un peu confus au sujet de l'apprentissage d'ensemble. En bref, il exécute k modèles et obtient la moyenne de ces k modèles. Comment peut-on garantir que la moyenne des modèles k serait meilleure que n'importe laquelle des modèles en soi? Je comprends que le biais est "étalé" ou "moyenné"....

machine-learning ensemble

14

La méthodologie de la forêt aléatoire peut-elle être appliquée aux régressions linéaires?

Les forêts aléatoires fonctionnent en créant un ensemble d'arbres de décision où chaque arbre est créé en utilisant un échantillon bootstrap des données de formation d'origine (échantillon à la fois de variables d'entrée et d'observations). Un processus similaire peut-il être appliqué pour la...

regression predictive-models ensemble

14

Utilisation de LASSO sur une forêt aléatoire

Je voudrais créer une forêt aléatoire en utilisant le processus suivant: Construisez un arbre sur un échantillon aléatoire des données et des fonctionnalités en utilisant le gain d'informations pour déterminer les divisions Terminer un nœud feuille s'il dépasse une profondeur prédéfinie OU toute...

classification random-forest lasso ensemble

14

Algorithme d'apprentissage d'ensemble de pointe dans les tâches de reconnaissance de formes?

La structure de cette question est la suivante: dans un premier temps, je donne le concept d' apprentissage d'ensemble , ensuite je donne une liste de tâches de reconnaissance de formes , puis je donne des exemples d'algorithmes d'apprentissage d'ensemble et, enfin, j'introduis ma question. Ceux...

machine-learning neural-networks pattern-recognition ensemble ocr

13

Pourquoi ne pas toujours utiliser l'apprentissage d'ensemble?

Il me semble que l'apprentissage d'ensemble donnera toujours de meilleures performances prédictives qu'avec une seule hypothèse d'apprentissage. Alors, pourquoi ne les utilisons-nous pas tout le temps? Je suppose que c'est peut-être à cause de limitations informatiques? (même alors, nous utilisons...

boosting ensemble bagging

13

Existe-t-il un problème théorique avec la moyenne des coefficients de régression pour construire un modèle?

Je veux construire un modèle de régression qui est une moyenne de plusieurs modèles OLS, chacun basé sur un sous-ensemble des données complètes. L'idée derrière cela est basée sur cet article . Je crée k plis et je crée k modèles OLS, chacun sur des données sans l'un des plis. Je fais ensuite la...

regression least-squares ensemble

13

Modèle de série chronologique d'ensemble

J'ai besoin d'automatiser les prévisions de séries chronologiques et je ne connais pas à l'avance les caractéristiques de ces séries (saisonnalité, tendance, bruit, etc.). Mon objectif n'est pas d'obtenir le meilleur modèle possible pour chaque série, mais d'éviter les très mauvais modèles. En...

time-series forecasting arima ensemble exponential-smoothing