Questions marquées «r»

9

Comment fonctionne l'argument ties.method de la fonction de classement de R?

J'utilise rank(a, ties.method="max")pour classer a. Mais je ne sais pas trop ce que cela fait ties.method="max". Peux-tu aider s'il te

r ranks ties

9

Intervalles de confiance autour d'un centroïde avec similitude de Gower modifiée

Je voudrais obtenir des intervalles de confiance de 95% pour les centroïdes sur la base de la similitude de Gower entre certains échantillons multivariés (données communautaires provenant de carottes de sédiments). Jusqu'à présent, j'ai utilisé le vegan{}package dans R pour obtenir une similitude...

r confidence-interval

9

Comment comparer les événements observés aux événements attendus?

Supposons que j'ai un échantillon de fréquences de 4 événements possibles: Event1 - 5 E2 - 1 E3 - 0 E4 - 12 et j'ai les probabilités attendues que mes événements se produisent: p1 - 0.2 p2 - 0.1 p3 - 0.1 p4 - 0.6 Avec la somme des fréquences observées de mes quatre événements (18), je peux calculer...

r statistical-significance chi-squared multivariate-analysis exponential joint-distribution statistical-significance self-study standard-deviation probability normal-distribution spss interpretation assumptions cox-model reporting cox-model statistical-significance reliability method-comparison classification boosting ensemble adaboost confidence-interval cross-validation prediction prediction-interval regression machine-learning svm regularization regression sampling survey probit matlab feature-selection information-theory mutual-information time-series forecasting simulation classification boosting ensemble adaboost normal-distribution multivariate-analysis covariance gini clustering text-mining distance-functions information-retrieval similarities regression logistic stata group-differences r anova confidence-interval repeated-measures r logistic lme4-nlme inference fiducial kalman-filter classification discriminant-analysis linear-algebra computing statistical-significance time-series panel-data missing-data uncertainty probability multivariate-analysis r classification spss k-means discriminant-analysis poisson-distribution average r random-forest importance probability conditional-probability distributions standard-deviation time-series machine-learning online forecasting r pca dataset data-visualization bayes distributions mathematical-statistics degrees-of-freedom

9

Distributions hyperprior pour les paramètres (matrice d'échelle et degrés de liberté) d'un wishart avant une matrice de covariance inverse

J'estime plusieurs matrices de covariance inverse d'un ensemble de mesures à travers différentes sous-populations en utilisant un wishart prior dans jags / rjags / R. Au lieu de spécifier une matrice d'échelle et des degrés de liberté sur la matrice de covariance inverse antérieure (la distribution...

bayesian covariance prior wishart hierarchical-bayesian

9

Comment utiliser R gbm avec distribution = “adaboost”?

La documentation indique que R gbm avec distribution = "adaboost" peut être utilisé pour un problème de classification 0-1. Considérez le fragment de code suivant: gbm_algorithm <- gbm(y ~ ., data = train_dataset, distribution = "adaboost", n.trees = 5000) gbm_predicted <-...

r gbm

9

Intervalles de confiance et de prédiction du modèle de régression linéaire

D'accord, j'essaie donc de comprendre la régression linéaire. J'ai un ensemble de données et tout semble assez bien, mais je suis confus. Voici mon modèle de résumé linéaire: Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 0.2068621 0.0247002 8.375 4.13e-09 *** temp 0.0031074...

r regression

9

Comparaison des taux d'incidence

Je veux comparer les taux d'incidence entre deux groupes (un sans maladie et un avec). Je prévoyais de calculer le taux d'incidence (IRR), c'est-à-dire le groupe de taux d'incidence B / groupe de taux d'incidence A, puis de tester si ce taux est égal à 1, et enfin de calculer des intervalles IC à...

r poisson-distribution epidemiology incidence-rate-ratio

9

Problème de calcul, d'interprétation des sous-ensembles de regs et questions générales sur la procédure de sélection de modèle

Je souhaite sélectionner des modèles à l'aide de regsubsets(). J'ai une trame de données appelée olympiadaten (données téléchargées: http://www.sendspace.com/file/8e27d0 ). J'attache d'abord ce dataframe puis commence à analyser, mon code est: attach(olympiadaten) library(leaps)...

r multiple-regression model-selection

9

Déterminer le plus grand contributeur d'un groupe

Je ne connais pas grand-chose aux statistiques, alors restez avec moi. Disons que j'ai un ensemble de 1000 travailleurs. Je veux savoir qui est le travailleur le plus acharné, mais je ne peux mesurer que la quantité de travail effectuée en groupes de 1 à 100 personnes sur une heure de travail. En...

r regression data-mining

9

Comment tracer 20 ans de données quotidiennes en séries chronologiques

J'ai le jeu de données suivant: https://dl.dropbox.com/u/22681355/ORACLE.csv et je voudrais tracer les changements quotidiens dans «Ouvrir» par «Date», j'ai donc fait ce qui suit: oracle <- read.csv(file="http://dl.dropbox.com/u/22681355/ORACLE.csv", header=TRUE) plot(oracle$Date, oracle$Open,...

r data-visualization

9

Box Cox se transforme pour la régression

J'essaie d'adapter un modèle linéaire sur certaines données avec un seul prédicteur (disons (x, y)). Les données sont telles que pour les petites valeurs de x, les valeurs y donnent un ajustement serré à une ligne droite, mais à mesure que les valeurs x augmentent, les valeurs y deviennent plus...

r regression variance data-transformation

9

Quelles sont les lignes rouges dans le graphique de régression quantile (package quantreg)?

En utilisant plot.rqdans le quantregpackage de R, nous pouvons tracer la distribution d'estimation des coefficients et obtenir quelque chose comme ceci: Quelles sont les lignes rouges pointillées? Une recherche approfondie sur Google a révélé que celle du milieu est la moyenne des 99 estimations,...

r data-visualization quantile-regression

9

Comment utilisez-vous le lissage exponentiel simple dans R?

Je suis débutant en R, pourriez-vous expliquer comment utiliser ses dans le package de prévision de la prévision R ? Je voudrais choisir le nombre de périodes initiales et la constante de lissage. d <-

r time-series forecasting

9

Lors de l'utilisation de glmnet, comment déclarer la signification de la valeur p pour revendiquer la signification des prédicteurs?

J'ai un grand ensemble de prédicteurs (plus de 43 000) pour prédire une variable dépendante qui peut prendre 2 valeurs (0 ou 1). Le nombre d'observations est supérieur à 45 000. La plupart des prédicteurs sont des unigrammes, des bigrammes et des trigrammes de mots, il y a donc un haut degré de...

r multiple-regression lasso glmnet

9

Modèle à risques proportionnels de Cox censuré par intervalles dans R

Étant donné les temps de survie à censure par intervalles, comment puis-je effectuer un modèle Cox PH à censure par intervalles dans R? Une recherche rseek révèle le package intcox, qui n'existe plus dans le Rréférentiel. Je suis presque certain que la coxphfonction dans le survivalpackage ne peut...

r survival cox-model interval-censoring

9

Confusion liée aux systèmes dynamiques linéaires

Je lisais ce livre Pattern Recognition and Machine Learning de Bishop. J'ai eu une confusion liée à une dérivation du système dynamique linéaire. Dans LDS, nous supposons que les variables latentes sont continues. Si Z désigne les variables latentes et X désigne les variables observées p ( zn| zn -...

machine-learning linear-model kalman-filter pattern-recognition graphical-model

9

Amorçage de données hiérarchiques / multiniveaux (rééchantillonnage de clusters)

Je produis un script pour créer des échantillons de bootstrap à partir de l' catsensemble de données (à partir du -MASS-package). En suivant le manuel de Davidson et Hinkley [1], j'ai effectué une régression linéaire simple et adopté une procédure fondamentale non paramétrique pour le bootstrap à...

r bootstrap fixed-effects-model

9

«Oubli» du prieur dans le cadre bayésien?

Il est bien connu que comme vous avez plus de preuves (par exemple sous la forme d' exemples pour n iid plus grands ), le prieur bayésien est "oublié", et la plupart des inférences sont affectées par les preuves (ou la probabilité).nnnnnn Il est facile de le voir pour divers cas spécifiques (tels...

bayesian prior

9

Calcul de la valeur de p inconnu

Je déboguais récemment un script R et j'ai trouvé quelque chose de très étrange, l'auteur a défini sa propre fonction de valeur p pval <- function(x, y){ if (x+y<20) { # x + y is small, requires R.basic p1<- nChooseK(x+y,x) * 2^-(x+y+1); p2<- nChooseK(x+y,y) * 2^-(x+y+1); pvalue =...

r hypothesis-testing p-value

9

Calcul de Jaccard ou d'un autre coefficient d'association pour des données binaires en utilisant la multiplication matricielle

Je veux savoir s'il existe un moyen possible de calculer le coefficient de Jaccard en utilisant la multiplication matricielle. J'ai utilisé ce code jaccard_sim <- function(x) { # initialize similarity matrix m <- matrix(NA, nrow=ncol(x),ncol=ncol(x),dimnames=list(colnames(x),colnames(x)))...

r matrix binary-data association-measure similarities