Questions marquées «clustering»

16
Hypothèses de l'analyse en grappes

Toutes mes excuses pour la question rudimentaire, je suis nouveau dans cette forme d'analyse et j'ai une compréhension très limitée des principes jusqu'à présent. Je me demandais simplement si bon nombre des hypothèses paramétriques pour les tests multivariés / univariés s'appliquent à l'analyse de...

16
Regroupement de données 1D

J'ai un ensemble de données, je veux créer des clusters sur ces données en fonction d'une seule variable (il n'y a pas de valeurs manquantes). Je veux créer 3 clusters basés sur cette variable. Quel algorithme de clustering utiliser, k-means, EM, DBSCAN etc.? Ma question principale est, dans...

15
Text Mining: comment regrouper des textes (par exemple des articles de presse) avec l'intelligence artificielle?

J'ai construit des réseaux de neurones (MLP (entièrement connecté), Elman (récurrent)) pour différentes tâches, comme jouer au Pong, classer les chiffres manuscrits et tout ça ... De plus, j'ai essayé de construire certains premiers réseaux de neurones convolutifs, par exemple pour classer des...

15
Quelle est l'intuition derrière les échantillons échangeables sous l'hypothèse nulle?

Les tests de permutation (également appelés test de randomisation, test de re-randomisation ou test exact) sont très utiles et s'avèrent utiles lorsque l'hypothèse de distribution normale requise par exemple t-testn'est pas remplie et lorsque la transformation des valeurs par classement des un test...

15
Quelle méthode de comparaison multiple utiliser pour un modèle lmer: lsmeans ou glht?

J'analyse un ensemble de données à l'aide d'un modèle à effets mixtes avec un effet fixe (condition) et deux effets aléatoires (participant en raison de la conception et de la paire du sujet). Le modèle a été généré avec le lme4package:

15
La précision de la machine augmentant le gradient diminue à mesure que le nombre d'itérations augmente

J'expérimente l'algorithme de la machine de renforcement de gradient via le caretpackage en R. À l'aide d'un petit ensemble de données d'admission à l'université, j'ai exécuté le code suivant: library(caret) ### Load admissions dataset. ### mydata <-

15
Séries temporelles et détection d'anomalies

Je voudrais configurer un algorithme pour détecter une anomalie dans les séries temporelles, et je prévois d'utiliser le clustering pour cela. Pourquoi devrais-je utiliser une matrice de distance pour le clustering et non les données brutes des séries temporelles ?, Pour la détection de l'anomalie,...

15
Comment calculer la pureté?

Dans l'analyse en grappes, comment calculer la pureté? Quelle est l'équation? Je ne cherche pas de code pour le faire pour moi. Soit ωkωk\omega_k le cluster k et cjcjc_j la classe j. La pureté est-elle pratiquement exacte? il semble que l'on additionne la quantité de classes véritablement classées...

14
k-signifie vs k-médiane?

Je sais qu'il y a un algorithme de clustering k-means et une k-médiane. L'un qui utilise la moyenne comme centre de la grappe et l'autre utilise la médiane. Ma question est: quand / où utiliser