Questions marquées «clustering»

10
Méthodes d'initialisation du clustering K-means

Je m'intéresse à l'état actuel de la technique pour sélectionner les semences initiales (centres de grappe) pour K-means. La recherche sur Google mène à deux choix populaires: sélection aléatoire des graines initiales, et, en utilisant la technique de sélection KMeans ++: Arthur & Vassilvitskii...

10
Comment regrouper les variables longitudinales?

J'ai un tas de variables qui contiennent des données longitudinales du jour 0 au jour 7. Je cherche une approche de regroupement appropriée qui peut regrouper ces variables longitudinales (pas des cas) en différents groupes. J'ai essayé d'analyser cet ensemble de données séparément par le temps,...

10
Répartir les distributions

J'ai plusieurs distributions (10 distributions dans la figure ci-dessous). En fait ce sont des histogrammes: il y a 70 valeurs sur l'axe des x qui sont les tailles de certaines particules dans une solution et pour chaque valeur de x la valeur correspondante de y est la proportion de particules dont...

10
R régression linéaire variable catégorielle valeur «cachée»

Ceci est juste un exemple que j'ai rencontré plusieurs fois, donc je n'ai pas d'échantillons de données. Exécution d'un modèle de régression linéaire dans R: a.lm = lm(Y ~ x1 + x2) x1est une variable continue. x2est catégorique et a trois valeurs, par exemple "Low", "Medium" et "High". Cependant,...

10
Pourquoi Anova () et drop1 () ont-ils fourni des réponses différentes pour les GLMM?

J'ai un GLMM du formulaire: lmer(present? ~ factor1 + factor2 + continuous + factor1*continuous + (1 | factor3), family=binomial) Lorsque j'utilise drop1(model, test="Chi"), j'obtiens des résultats différents de ceux que j'utilise à Anova(model, type="III")partir du package de voiture ou...

10
Qu'est-il arrivé à Fuzzy Logic?

La logique floue semblait être un domaine de recherche actif dans l'apprentissage automatique et l'exploration de données lorsque j'étais à l'école (début des années 2000). Les systèmes d'inférence floue, les moyens c flous, les versions floues des divers réseaux de neurones et les architectures de...

10
Comment obtenir l'intervalle de confiance sur le changement du carré de la population

Pour un exemple simple, supposons qu'il existe deux modèles de régression linéaire Modèle 1 a trois prédicteurs, x1a, x2betx2c Le modèle 2 a trois prédicteurs du modèle 1 et deux prédicteurs supplémentaires x2aetx2b Il existe une équation de régression de la population où la variance de la...

10
PyMC pour le regroupement non paramétrique: le processus de Dirichlet pour estimer les paramètres du mélange gaussien ne parvient pas à se regrouper

Configuration du problème L'un des premiers problèmes de jouets auquel j'ai voulu appliquer PyMC est le clustering non paramétrique: étant donné certaines données, modélisez-le comme un mélange gaussien et apprenez le nombre de clusters et la moyenne et la covariance de chaque cluster. La plupart...

10
Comment dois-je interpréter les statistiques GAP?

J'ai utilisé la statistique GAP pour estimer k grappes dans R. Cependant, je ne suis pas sûr de bien l'interpréter. D'après l'intrigue ci-dessus, je suppose que je devrais utiliser 3 clusters. Dans la deuxième parcelle, je devrais choisir 6 grappes. Est-ce une interprétation correcte des...