Questions marquées «pca»

L'analyse en composantes principales (ACP) est une technique de réduction de dimensionnalité linéaire. Il réduit un ensemble de données multivarié à un plus petit ensemble de variables construites en préservant autant d'informations (autant de variance) que possible. Ces variables, appelées composantes principales, sont des combinaisons linéaires des variables d'entrée.

147
L’analyse en composantes principales peut-elle être appliquée à des ensembles de données contenant un mélange de variables continues et catégorielles?

J'ai un jeu de données qui contient à la fois des données continues et catégoriques. J'analyse en utilisant PCA et je me demande s'il est acceptable d'inclure les variables catégoriques dans le cadre de l'analyse. D'après ce que j'ai compris, l'ACP ne peut être appliquée qu'à des variables...

78
Un exemple: régression LASSO utilisant glmnet pour les résultats binaires

Je commence à me familiariser avec l’utilisation de glmnetavec LASSO Regression, où mon résultat d’intérêt est dichotomique. J'ai créé un petit cadre de données fictif ci-dessous: age <- c(4, 8, 7, 12, 6, 9, 10, 14, 7) gender <- c(1, 0, 1, 1, 1, 0, 1, 0, 0) bmi_p <- c(0.86, 0.45, 0.99,...

67
Chargements vs vecteurs propres dans PCA: quand utiliser l'un ou l'autre?

En analyse en composantes principales (ACP), nous obtenons des vecteurs propres (vecteurs unitaires) et des valeurs propres. Maintenant, définissons les charges comme Loadings=Eigenvectors⋅Eigenvalues−−−−−−−−−−√.Loadings=Eigenvectors⋅Eigenvalues.\text{Loadings} = \text{Eigenvectors} \cdot...

61
Quelle est la relation entre le clustering k-means et PCA?

Il est courant d'appliquer PCA (analyse en composantes principales) avant un algorithme de classification (tel que k-means). On pense que cela améliore les résultats de regroupement dans la pratique (réduction du bruit). Cependant, je suis intéressé par une étude comparative et approfondie de la...