Questions marquées «ranks»

16

Qu'est-ce qu'une donnée liée dans le contexte d'un coefficient de corrélation de rang?

Je ne suis pas dans le domaine des statistiques. J'ai vu le mot «données liées» en lisant les coefficients de corrélation de rang. Qu'est-ce que les données liées? Qu'est-ce qu'un exemple de données liées?

correlation nonparametric ranks

15

Pourquoi le test U de Mann – Whitney est-il significatif lorsque les médianes sont égales?

J'ai reçu un résultat d'un test de classement de Mann-Whitney que je ne comprends pas. La médiane des 2 populations est identique (6,9). Les quantiles supérieurs et inférieurs de chaque population sont: 6.64 & 7.2 6.60 & 7.1 La valeur de p résultant du test comparant ces populations est de...

nonparametric median ranks wilcoxon-mann-whitney

15

La précision de la machine augmentant le gradient diminue à mesure que le nombre d'itérations augmente

J'expérimente l'algorithme de la machine de renforcement de gradient via le caretpackage en R. À l'aide d'un petit ensemble de données d'admission à l'université, j'ai exécuté le code suivant: library(caret) ### Load admissions dataset. ### mydata <-

machine-learning caret boosting gbm hypothesis-testing t-test panel-data psychometrics intraclass-correlation generalized-linear-model categorical-data binomial model intercept causality cross-correlation distributions ranks p-value z-test sign-test time-series references terminology cross-correlation definition probability distributions beta-distribution inverse-gamma missing-data paired-comparisons paired-data clustered-standard-errors cluster-sample time-series arima logistic binary-data odds-ratio medicine hypothesis-testing wilcoxon-mann-whitney unsupervised-learning hierarchical-clustering neural-networks train clustering k-means regression ordinal-data change-scores machine-learning experiment-design roc precision-recall auc stata multilevel-analysis regression fitting nonlinear jmp r data-visualization gam gamm4 r lme4-nlme many-categories regression causality instrumental-variables endogeneity controlling-for-a-variable

14

Caret glmnet vs cv.glmnet

Il semble y avoir beaucoup de confusion dans la comparaison de l'utilisation à l' glmnetintérieur caretpour rechercher un lambda optimal et à utiliser cv.glmnetpour faire la même tâche. De nombreuses questions ont été posées, par exemple: Modèle de classification train.glmnet vs cv.glmnet? Quelle...

r caret glmnet machine-learning neural-networks maximum softmax probability distributions mathematical-statistics random-variable cdf statistical-significance variance expected-value ratio sample-size reliability tolerance-interval wilcoxon-signed-rank self-study variance sampling mean machine-learning svm libsvm self-study sampling ranks data-visualization histogram machine-learning classification normal-distribution mathematical-statistics maximum-likelihood mixture predictive-models prediction seasonality

12

Comment effectuer l'imputation de valeurs dans un très grand nombre de points de données?

J'ai un très grand ensemble de données et il manque environ 5% de valeurs aléatoires. Ces variables sont corrélées entre elles. L'exemple de jeu de données R suivant n'est qu'un exemple de jouet avec des données corrélées factices. set.seed(123) # matrix of X variable xmat <- matrix(sample(-1:1,...

r random-forest missing-data data-imputation multiple-imputation large-data definition moving-window self-study categorical-data econometrics standard-error regression-coefficients normal-distribution pdf lognormal regression python scikit-learn interpolation r self-study poisson-distribution chi-squared matlab matrix r modeling multinomial mlogit choice monte-carlo indicator-function r aic garch likelihood r regression repeated-measures simulation multilevel-analysis chi-squared expected-value multinomial yates-correction classification regression self-study repeated-measures references residuals confidence-interval bootstrap normality-assumption resampling entropy cauchy clustering k-means r clustering categorical-data continuous-data r hypothesis-testing nonparametric probability bayesian pdf distributions exponential repeated-measures random-effects-model non-independent regression error regression-to-the-mean correlation group-differences post-hoc neural-networks r time-series t-test p-value normalization probability moments mgf time-series model seasonality r anova generalized-linear-model proportion percentage nonparametric ranks weighted-regression variogram classification neural-networks fuzzy variance dimensionality-reduction confidence-interval proportion z-test r self-study pdf

11

Affichage des données ordinales - moyennes, médianes et rangs moyens

J'ai des données ordinales qui ne sont pas normalement distribuées, j'ai donc décidé de faire des tests non paramétriques en utilisant le test U de Mann-Whitney. Je regarde les différences entre les groupes pour sept scores - ces scores sont soit 0, 1, 2 ou 3 pour chaque sujet. J'ai du mal à...

spss mean wilcoxon-mann-whitney ranks presentation

10

Pourquoi Anova () et drop1 () ont-ils fourni des réponses différentes pour les GLMM?

J'ai un GLMM du formulaire: lmer(present? ~ factor1 + factor2 + continuous + factor1*continuous + (1 | factor3), family=binomial) Lorsque j'utilise drop1(model, test="Chi"), j'obtiens des résultats différents de ceux que j'utilise à Anova(model, type="III")partir du package de voiture ou...

r anova glmm r mixed-model bootstrap sample-size cross-validation roc auc sampling stratification random-allocation logistic stata interpretation proportion r regression multiple-regression linear-model lm r cross-validation cart rpart logistic generalized-linear-model econometrics experiment-design causality instrumental-variables random-allocation predictive-models data-mining estimation contingency-tables epidemiology standard-deviation mean ancova psychology statistical-significance cross-validation synthetic-data poisson-distribution negative-binomial bioinformatics sequence-analysis distributions binomial classification k-means distance unsupervised-learning euclidean correlation chi-squared spearman-rho forecasting excel exponential-smoothing binomial sample-size r change-point wilcoxon-signed-rank ranks clustering matlab covariance covariance-matrix normal-distribution simulation random-generation bivariate standardization confounding z-statistic forecasting arima minitab poisson-distribution negative-binomial poisson-regression overdispersion probability self-study markov-process estimation maximum-likelihood classification pca group-differences chi-squared survival missing-data contingency-tables anova proportion

9

Comment fonctionne l'argument ties.method de la fonction de classement de R?

J'utilise rank(a, ties.method="max")pour classer a. Mais je ne sais pas trop ce que cela fait ties.method="max". Peux-tu aider s'il te

r ranks ties

9

Pourquoi une corrélation Pearson des rangs est-elle valide malgré l'hypothèse de normalité?

Je lis actuellement des hypothèses sur les corrélations de Pearson. Une hypothèse importante pour le test t qui suit semble être que les deux variables proviennent de distributions normales; s'ils ne le font pas, l'utilisation de mesures alternatives telles que le Spearman rho est préconisée. La...

correlation normality-assumption spearman-rho ranks

8

Avons-nous besoin de nous inquiéter des valeurs aberrantes lors de l'utilisation de tests basés sur le classement?

Toutes mes excuses si c'est une question très basique. Si nous avons des données qui ne sont pas normalement distribuées (par exemple asymétriques, le test de Shapiro-Wilk est significatif) et que nous recourons à des méthodes basées sur le classement (par exemple le test de Wilcoxon Signed Rank),...

outliers ranks

8

Rang et transformation en z au lieu de Wilcoxon?

Andrew Gelman dans un récent article de son blog suggère d'utiliser un classement, de transformer le classement en z-score, puis d'utiliser des tests et des outils paramétriques au lieu d'effectuer des tests non paramétriques. Je n'en avais jamais entendu parler auparavant. Une recherche sur Google...

nonparametric wilcoxon-mann-whitney wilcoxon-signed-rank ranks nonparametric-regression