J'utilise rank(a, ties.method="max")pour classer a. Mais je ne sais pas trop ce que cela fait ties.method="max". Peux-tu aider s'il te
J'utilise rank(a, ties.method="max")pour classer a. Mais je ne sais pas trop ce que cela fait ties.method="max". Peux-tu aider s'il te
Je voudrais obtenir des intervalles de confiance de 95% pour les centroïdes sur la base de la similitude de Gower entre certains échantillons multivariés (données communautaires provenant de carottes de sédiments). Jusqu'à présent, j'ai utilisé le vegan{}package dans R pour obtenir une similitude...
Supposons que j'ai un échantillon de fréquences de 4 événements possibles: Event1 - 5 E2 - 1 E3 - 0 E4 - 12 et j'ai les probabilités attendues que mes événements se produisent: p1 - 0.2 p2 - 0.1 p3 - 0.1 p4 - 0.6 Avec la somme des fréquences observées de mes quatre événements (18), je peux calculer...
J'estime plusieurs matrices de covariance inverse d'un ensemble de mesures à travers différentes sous-populations en utilisant un wishart prior dans jags / rjags / R. Au lieu de spécifier une matrice d'échelle et des degrés de liberté sur la matrice de covariance inverse antérieure (la distribution...
La documentation indique que R gbm avec distribution = "adaboost" peut être utilisé pour un problème de classification 0-1. Considérez le fragment de code suivant: gbm_algorithm <- gbm(y ~ ., data = train_dataset, distribution = "adaboost", n.trees = 5000) gbm_predicted <-...
D'accord, j'essaie donc de comprendre la régression linéaire. J'ai un ensemble de données et tout semble assez bien, mais je suis confus. Voici mon modèle de résumé linéaire: Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 0.2068621 0.0247002 8.375 4.13e-09 *** temp 0.0031074...
Je veux comparer les taux d'incidence entre deux groupes (un sans maladie et un avec). Je prévoyais de calculer le taux d'incidence (IRR), c'est-à-dire le groupe de taux d'incidence B / groupe de taux d'incidence A, puis de tester si ce taux est égal à 1, et enfin de calculer des intervalles IC à...
Je souhaite sélectionner des modèles à l'aide de regsubsets(). J'ai une trame de données appelée olympiadaten (données téléchargées: http://www.sendspace.com/file/8e27d0 ). J'attache d'abord ce dataframe puis commence à analyser, mon code est: attach(olympiadaten) library(leaps)...
Je ne connais pas grand-chose aux statistiques, alors restez avec moi. Disons que j'ai un ensemble de 1000 travailleurs. Je veux savoir qui est le travailleur le plus acharné, mais je ne peux mesurer que la quantité de travail effectuée en groupes de 1 à 100 personnes sur une heure de travail. En...
J'ai le jeu de données suivant: https://dl.dropbox.com/u/22681355/ORACLE.csv et je voudrais tracer les changements quotidiens dans «Ouvrir» par «Date», j'ai donc fait ce qui suit: oracle <- read.csv(file="http://dl.dropbox.com/u/22681355/ORACLE.csv", header=TRUE) plot(oracle$Date, oracle$Open,...
J'essaie d'adapter un modèle linéaire sur certaines données avec un seul prédicteur (disons (x, y)). Les données sont telles que pour les petites valeurs de x, les valeurs y donnent un ajustement serré à une ligne droite, mais à mesure que les valeurs x augmentent, les valeurs y deviennent plus...
En utilisant plot.rqdans le quantregpackage de R, nous pouvons tracer la distribution d'estimation des coefficients et obtenir quelque chose comme ceci: Quelles sont les lignes rouges pointillées? Une recherche approfondie sur Google a révélé que celle du milieu est la moyenne des 99 estimations,...
Je suis débutant en R, pourriez-vous expliquer comment utiliser ses dans le package de prévision de la prévision R ? Je voudrais choisir le nombre de périodes initiales et la constante de lissage. d <-
J'ai un grand ensemble de prédicteurs (plus de 43 000) pour prédire une variable dépendante qui peut prendre 2 valeurs (0 ou 1). Le nombre d'observations est supérieur à 45 000. La plupart des prédicteurs sont des unigrammes, des bigrammes et des trigrammes de mots, il y a donc un haut degré de...
Étant donné les temps de survie à censure par intervalles, comment puis-je effectuer un modèle Cox PH à censure par intervalles dans R? Une recherche rseek révèle le package intcox, qui n'existe plus dans le Rréférentiel. Je suis presque certain que la coxphfonction dans le survivalpackage ne peut...
Je lisais ce livre Pattern Recognition and Machine Learning de Bishop. J'ai eu une confusion liée à une dérivation du système dynamique linéaire. Dans LDS, nous supposons que les variables latentes sont continues. Si Z désigne les variables latentes et X désigne les variables observées p ( zn| zn -...
Je produis un script pour créer des échantillons de bootstrap à partir de l' catsensemble de données (à partir du -MASS-package). En suivant le manuel de Davidson et Hinkley [1], j'ai effectué une régression linéaire simple et adopté une procédure fondamentale non paramétrique pour le bootstrap à...
Il est bien connu que comme vous avez plus de preuves (par exemple sous la forme d' exemples pour n iid plus grands ), le prieur bayésien est "oublié", et la plupart des inférences sont affectées par les preuves (ou la probabilité).nnnnnn Il est facile de le voir pour divers cas spécifiques (tels...
Je déboguais récemment un script R et j'ai trouvé quelque chose de très étrange, l'auteur a défini sa propre fonction de valeur p pval <- function(x, y){ if (x+y<20) { # x + y is small, requires R.basic p1<- nChooseK(x+y,x) * 2^-(x+y+1); p2<- nChooseK(x+y,y) * 2^-(x+y+1); pvalue =...
Je veux savoir s'il existe un moyen possible de calculer le coefficient de Jaccard en utilisant la multiplication matricielle. J'ai utilisé ce code jaccard_sim <- function(x) { # initialize similarity matrix m <- matrix(NA, nrow=ncol(x),ncol=ncol(x),dimnames=list(colnames(x),colnames(x)))...