Statistiques et Big Data

21
Mesurer la similitude des documents

Pour regrouper (texte) des documents, vous avez besoin d'un moyen de mesurer la similitude entre des paires de documents. Deux alternatives sont: Comparez les documents comme vecteurs de termes en utilisant la similitude cosinus - et TF / IDF comme pondérations pour les termes. Comparer la...

21
Comment projeter un nouveau vecteur sur l'espace PCA?

Après avoir effectué l'analyse des composants principaux (PCA), je souhaite projeter un nouveau vecteur sur l'espace PCA (c'est-à-dire trouver ses coordonnées dans le système de coordonnées PCA). J'ai calculé PCA en langage R en utilisant prcomp. Maintenant, je devrais pouvoir multiplier mon...

21
Introduction à la théorie de la mesure

Je souhaite en savoir plus sur les techniques bayésiennes non paramétriques (et connexes). J'ai une formation en informatique et bien que je n'aie jamais suivi de cours sur la théorie des mesures ou la théorie des probabilités, j'ai eu une formation limitée en probabilités et statistiques....

21
Comment utiliser les poids dans la fonction lm dans R?

Verrouillé . Cette question et ses réponses sont verrouillées car la question est hors sujet mais a une signification historique. Il n'accepte pas actuellement de nouvelles réponses ou interactions. Quelqu'un pourrait-il offrir des conseils sur la façon d'utiliser l' weightsargument dans la...

21
Difficulté de tester la linéarité en régression

Dans la modélisation statistique: les deux cultures, Leo Breiman écrit La pratique appliquée actuelle consiste à vérifier l'ajustement du modèle de données à l'aide de tests d'adéquation et d'analyse résiduelle. À un moment donné, il y a quelques années, j'ai mis en place un problème de régression...

21
Ajuster un modèle exponentiel aux données

Cette question a été migrée à partir de Stack Overflow car il est possible d'y répondre sur la validation croisée. Migré il y a 8 ans . J'ai 2 variables, toutes deux de la classe "numérique": > head(y) [1] 0.4651804 0.6185849 0.3766175 0.5489810 0.3695258 0.4002567 > head(x) [1] 59.32820...