Statistiques et Big Data

61
Où couper un dendrogramme?

La classification hiérarchique peut être représentée par un dendrogramme. Couper un dendrogramme à un certain niveau donne un ensemble de grappes. La coupe à un autre niveau donne un autre ensemble de grappes. Comment choisiriez-vous où couper le dendrogramme? Y at-il quelque chose que nous...

61
Rapport de vraisemblance vs facteur Bayes

Je suis plutôt évangélique quant à l'utilisation des ratios de vraisemblance pour représenter l'évidence objective de / contre un phénomène donné. Cependant, j’ai récemment appris que le facteur Bayes remplissait une fonction similaire dans le contexte des méthodes bayésiennes (c’est-à-dire que le...

61
Pourquoi le Jeffreys avant est-il utile?

Je comprends que le prior de Jeffreys est invariant sous re-paramétrage. Cependant, ce que je ne comprends pas, c'est pourquoi cette propriété est souhaitée. Pourquoi ne voudriez-vous pas que l’avant change avec un changement de

61
Quelle est la relation entre le clustering k-means et PCA?

Il est courant d'appliquer PCA (analyse en composantes principales) avant un algorithme de classification (tel que k-means). On pense que cela améliore les résultats de regroupement dans la pratique (réduction du bruit). Cependant, je suis intéressé par une étude comparative et approfondie de la...