Questions marquées «survey»

Désigne un instrument utilisé pour prélever un échantillon d'une population. L'enquête fait souvent référence à l'échantillonnage de populations humaines et se fait principalement en administrant des questionnaires ou en interrogeant des individus. L'échantillonnage d'individus pour des enquêtes dans des populations stratifiées peut nécessiter un échantillonnage plus complexe qu'un simple échantillonnage aléatoire pour obtenir des estimations plus précises des paramètres de la population. La conception de l'échantillonnage et l'analyse des données d'enquête relèvent de la «méthodologie d'enquête».

78
Un exemple: régression LASSO utilisant glmnet pour les résultats binaires

Je commence à me familiariser avec l’utilisation de glmnetavec LASSO Regression, où mon résultat d’intérêt est dichotomique. J'ai créé un petit cadre de données fictif ci-dessous: age <- c(4, 8, 7, 12, 6, 9, 10, 14, 7) gender <- c(1, 0, 1, 1, 1, 0, 1, 0, 0) bmi_p <- c(0.86, 0.45, 0.99,...

29
Comment gérer les données hiérarchiques / imbriquées dans l'apprentissage automatique

Je vais expliquer mon problème avec un exemple. Supposons que vous souhaitiez prédire le revenu d'un individu en fonction de certains attributs: {âge, sexe, pays, région, ville}. Vous avez un ensemble de données de formation comme ça train <- data.frame(CountryID=c(1,1,1,1, 2,2,2,2, 3,3,3,3),...

28
Calcul de la répétabilité des effets d'un modèle lmer

Je viens de tomber sur cet article , qui décrit comment calculer la répétabilité (aka fiabilité, aka corrélation intraclasse) d'une mesure via la modélisation d'effets mixtes. Le code R serait: #fit the model fit = lmer(dv~(1|unit),data=my_data) #obtain the variance estimates vc = VarCorr(fit)...

21
Comment projeter un nouveau vecteur sur l'espace PCA?

Après avoir effectué l'analyse des composants principaux (PCA), je souhaite projeter un nouveau vecteur sur l'espace PCA (c'est-à-dire trouver ses coordonnées dans le système de coordonnées PCA). J'ai calculé PCA en langage R en utilisant prcomp. Maintenant, je devrais pouvoir multiplier mon...

18
utilisation des poids dans svyglm vs glm

Je voudrais savoir en quoi le traitement des poids diffère entre svyglmetglm J'utilise le twangpackage dans R pour créer des scores de propension qui sont ensuite utilisés comme poids, comme suit (ce code provient de la twangdocumentation): library(twang) library(survey) set.seed(1) data(lalonde)...

16
Comment calculer la durée moyenne d'adhésion au végétarisme alors que nous ne disposons que de données d'enquête sur les végétariens actuels?

Un échantillon de population aléatoire a été sondé. On leur a demandé s'ils avaient un régime végétarien. S'ils ont répondu oui, on leur a également demandé de préciser depuis combien de temps ils suivaient un régime végétarien sans interruption. Je veux utiliser ces données pour calculer la durée...

13
Comment traiter les réponses aux sondages illogiques

J'ai soumis un sondage à un échantillon d'artistes. L'une des questions était d'indiquer le pourcentage des revenus provenant: de l'activité artistique, du soutien gouvernemental, de la pension privée, des activités non liées aux arts. Environ 65% des individus ont répondu que la somme du...

12
Validation des questionnaires

Je conçois un questionnaire pour ma thèse. Je suis en train de valider le questionnaire J'ai appliqué un test alpha de Cronbach au groupe d'échantillons initial. Les réponses au questionnaire sont sur une échelle de Likert; quelqu'un peut-il suggérer d'autres tests à appliquer pour aider à tester...

10
R régression linéaire variable catégorielle valeur «cachée»

Ceci est juste un exemple que j'ai rencontré plusieurs fois, donc je n'ai pas d'échantillons de données. Exécution d'un modèle de régression linéaire dans R: a.lm = lm(Y ~ x1 + x2) x1est une variable continue. x2est catégorique et a trois valeurs, par exemple "Low", "Medium" et "High". Cependant,...

10
Modèle d'historique d'événement à temps discret (survie) dans R

J'essaie d'adapter un modèle à temps discret dans R, mais je ne sais pas comment le faire. J'ai lu que vous pouvez organiser la variable dépendante dans différentes lignes, une pour chaque observation de temps, et utiliser la glmfonction avec un lien logit ou cloglog. En ce sens, j'ai trois...

9
Comment comparer les événements observés aux événements attendus?

Supposons que j'ai un échantillon de fréquences de 4 événements possibles: Event1 - 5 E2 - 1 E3 - 0 E4 - 12 et j'ai les probabilités attendues que mes événements se produisent: p1 - 0.2 p2 - 0.1 p3 - 0.1 p4 - 0.6 Avec la somme des fréquences observées de mes quatre événements (18), je peux calculer...