Statistiques et Big Data

25
Comment les bayésiens comparent-ils les distributions?

Donc, je pense que j'ai une bonne compréhension des bases de la probabilité fréquentiste et de l'analyse statistique (et à quel point elle peut être utilisée). Dans un monde fréquentiste, il est logique de poser une question telle que "cette distribution est-elle différente de cette distribution",...

25
LSA contre PCA (regroupement de documents)

J'étudie différentes techniques utilisées dans le clustering de documents et je voudrais dissiper certains doutes concernant PCA (analyse en composantes principales) et LSA (analyse sémantique latente). Première chose - quelles sont les différences entre eux? Je sais qu'en PCA, la décomposition SVD...

25
Dessin de la distribution Dirichlet

Disons que nous avons une distribution de Dirichlet avec le paramètre de vecteur dimension . Comment puis-je tirer un échantillon (un vecteur dimensionnel) de cette distribution? J'ai besoin d'une explication (éventuellement) simple.→ α = [ α 1 , α 2 , . . . , α K ]KKKα⃗ = [ α1, α2, . . . ,...

25
Comment utiliser les résultats de R prcomp pour la prédiction?

J'ai un data.frame avec 800 obs. de 40 variables, et j'aimerais utiliser l'analyse des composants principaux pour améliorer les résultats de ma prédiction (qui fonctionne jusqu'à présent le mieux avec Support Vector Machine sur une quinzaine de variables sélectionnées à la main). Je comprends qu'un...