Questions marquées «algorithms»

Un algorithme est un ensemble d'un ou plusieurs calculs qui produiront un résultat calculé. Toutes les méthodes statistiques sont des algorithmes. Les algorithmes peuvent être simples, comme calculer un pourcentage, ou peuvent être très complexes et nécessitent un ordinateur pour des résultats rapides et précis.

56
Quand un modèle est-il sous-équipé?

La logique dit souvent qu'en sous-équipant un modèle, sa capacité à généraliser est accrue. Cela dit, il est clair qu’à un moment donné, un modèle insuffisamment aménagé s’aggrave, quelle que soit la complexité des données. Comment savoir si votre modèle a trouvé le juste équilibre et ne...

39
Quand utiliser quoi - Machine Learning [fermé]

Récemment, dans une classe d'apprentissage automatique du professeur Oriol Pujol à UPC / Barcelone, il a décrit les algorithmes, principes et concepts les plus courants à utiliser pour une large gamme de tâches liées à l'apprentissage automatique. Ici, je les partage avec vous et vous demande:...

29
Pourquoi xgboost est-il tellement plus rapide que sklearn GradientBoostingClassifier?

J'essaie de former un modèle d'augmentation de gradient sur plus de 50k exemples avec 100 fonctionnalités numériques. XGBClassifiergère 500 arbres en 43 secondes sur ma machine, alors qu'il GradientBoostingClassifierne gère que 10 arbres (!) en 1 minute et 2 secondes :( Je n'ai pas pris la peine...

18
Regroupement basé sur des scores de similitude

Supposons que nous avons un ensemble d'éléments E et une similitude ( non loin ) fonction SIM (ei, ej) entre deux éléments ei, ej ∈ E . Comment pourrions-nous (efficacement) regrouper les éléments de E , en utilisant sim ? k -moyen, par exemple, nécessite un k donné , Canopy Clustering nécessite...

18
Comment faire évoluer le développement d'algorithmes?

En travaillant sur l'analyse exploratoire des données et en développant des algorithmes, je trouve que la plupart de mon temps est consacré à un cycle de visualisation, d'écriture de code, d'exécution sur un petit ensemble de données, de répétition. Les données que j'ai ont tendance à être des...

15
K-means vs K-means en ligne

K-means est un algorithme bien connu pour le clustering, mais il existe également une variante en ligne de cet algorithme (K-means en ligne). Quels sont les avantages et les inconvénients de ces approches et quand devraient-elles être