Questions marquées «machine-learning»

8
sklearn - problème de surajustement

Je recherche des recommandations sur la meilleure façon de résoudre mon problème actuel d'apprentissage automatique Le contour du problème et ce que j'ai fait est le suivant: J'ai plus de 900 essais de données EEG, où chaque essai dure 1 seconde. La vérité fondamentale est connue pour chacun et...

8
Quelle est la différence entre les vecteurs propres à matrice d'affinité et les vecteurs propres à graphes laplaciens dans le contexte du regroupement spectral?

Dans le clustering spectral, il est courant de résoudre le problème des vecteurs propres L v = λ vLv=λvL v = \lambda v où est le graphe laplacien, est le vecteur propre lié à la valeur propre .LLLvvvλλ\lambda Ma question: pourquoi s'embêter à prendre le graphe laplacien? Ne pourrais-je pas...

8
Classification des e-mails dans R

Je travaille sur un projet dans R où j'ai environ 1200 e-mails d'une entreprise, dont la plupart sont étiquetés classe11_{1} ou classe22_{2}, qui sont les types de demandes. Environ 1000 e-mails sont étiquetés classe11_{1}et 200 sont étiquetés classe22_{2}Mon objectif est d'utiliser l'apprentissage...

8
Comment évaluer le clustering de texte?

Quelles mesures peuvent être utilisées pour évaluer les modèles de clustering de texte? J'ai utilisé tf-idf+ k-means, tf-idf+ hierarchical clustering, doc2vec+ k-means (metric is cosine similarity), doc2vec+ hierarchical clustering (metric is cosine similarity). Comment décider quel modèle est le...