Je ne suis pas dans le domaine des statistiques. J'ai vu le mot «données liées» en lisant les coefficients de corrélation de rang. Qu'est-ce que les données liées? Qu'est-ce qu'un exemple de données liées?
Je ne suis pas dans le domaine des statistiques. J'ai vu le mot «données liées» en lisant les coefficients de corrélation de rang. Qu'est-ce que les données liées? Qu'est-ce qu'un exemple de données liées?
J'ai reçu un résultat d'un test de classement de Mann-Whitney que je ne comprends pas. La médiane des 2 populations est identique (6,9). Les quantiles supérieurs et inférieurs de chaque population sont: 6.64 & 7.2 6.60 & 7.1 La valeur de p résultant du test comparant ces populations est de...
J'expérimente l'algorithme de la machine de renforcement de gradient via le caretpackage en R. À l'aide d'un petit ensemble de données d'admission à l'université, j'ai exécuté le code suivant: library(caret) ### Load admissions dataset. ### mydata <-
Il semble y avoir beaucoup de confusion dans la comparaison de l'utilisation à l' glmnetintérieur caretpour rechercher un lambda optimal et à utiliser cv.glmnetpour faire la même tâche. De nombreuses questions ont été posées, par exemple: Modèle de classification train.glmnet vs cv.glmnet? Quelle...
J'ai un très grand ensemble de données et il manque environ 5% de valeurs aléatoires. Ces variables sont corrélées entre elles. L'exemple de jeu de données R suivant n'est qu'un exemple de jouet avec des données corrélées factices. set.seed(123) # matrix of X variable xmat <- matrix(sample(-1:1,...
J'ai des données ordinales qui ne sont pas normalement distribuées, j'ai donc décidé de faire des tests non paramétriques en utilisant le test U de Mann-Whitney. Je regarde les différences entre les groupes pour sept scores - ces scores sont soit 0, 1, 2 ou 3 pour chaque sujet. J'ai du mal à...
J'ai un GLMM du formulaire: lmer(present? ~ factor1 + factor2 + continuous + factor1*continuous + (1 | factor3), family=binomial) Lorsque j'utilise drop1(model, test="Chi"), j'obtiens des résultats différents de ceux que j'utilise à Anova(model, type="III")partir du package de voiture ou...
J'utilise rank(a, ties.method="max")pour classer a. Mais je ne sais pas trop ce que cela fait ties.method="max". Peux-tu aider s'il te
Je lis actuellement des hypothèses sur les corrélations de Pearson. Une hypothèse importante pour le test t qui suit semble être que les deux variables proviennent de distributions normales; s'ils ne le font pas, l'utilisation de mesures alternatives telles que le Spearman rho est préconisée. La...
Toutes mes excuses si c'est une question très basique. Si nous avons des données qui ne sont pas normalement distribuées (par exemple asymétriques, le test de Shapiro-Wilk est significatif) et que nous recourons à des méthodes basées sur le classement (par exemple le test de Wilcoxon Signed Rank),...
Andrew Gelman dans un récent article de son blog suggère d'utiliser un classement, de transformer le classement en z-score, puis d'utiliser des tests et des outils paramétriques au lieu d'effectuer des tests non paramétriques. Je n'en avais jamais entendu parler auparavant. Une recherche sur Google...