Questions marquées «continuous-data»

Une variable aléatoire X X est appelé continu si son ensemble de valeurs possibles est indénombrable, et la chance qu'il prenne une valeur particulière est zéro ( P ( X = x ) = 0 P(X=x)=0 pour chaque nombre réel X x ). Une variable aléatoire est continue si et seulement si sa fonction de distribution de probabilité cumulative est une fonction continue.

78
Un exemple: régression LASSO utilisant glmnet pour les résultats binaires

Je commence à me familiariser avec l’utilisation de glmnetavec LASSO Regression, où mon résultat d’intérêt est dichotomique. J'ai créé un petit cadre de données fictif ci-dessous: age <- c(4, 8, 7, 12, 6, 9, 10, 14, 7) gender <- c(1, 0, 1, 1, 1, 0, 1, 0, 0) bmi_p <- c(0.86, 0.45, 0.99,...

22
Quand devrions-nous discrétiser / classer les variables / caractéristiques indépendantes continues et quand ne le devrions-nous pas?

Quand devrions-nous discrétiser / classer les variables / fonctionnalités indépendantes et quand ne le devrions-nous pas? Mes tentatives pour répondre à la question: En général, nous ne devons pas bin, car le binning perdra des informations. Le binning augmente en fait le degré de liberté du...

13
lorsque

Je sais que pour la variable continue .P[ X= x ] = 0P[X=x]=0P[X=x]=0 Mais je ne peux pas visualiser que si , il y a un nombre infini de x possibles . Et aussi pourquoi leurs probabilités deviennent-elles infiniment petites?P[ X= x ] =

12
Comment effectuer l'imputation de valeurs dans un très grand nombre de points de données?

J'ai un très grand ensemble de données et il manque environ 5% de valeurs aléatoires. Ces variables sont corrélées entre elles. L'exemple de jeu de données R suivant n'est qu'un exemple de jouet avec des données corrélées factices. set.seed(123) # matrix of X variable xmat <- matrix(sample(-1:1,...