Questions marquées «r»

22

Qu'est-ce que l'échantillonnage d'importance?

J'essaie d'apprendre l'apprentissage par renforcement et ce sujet me dérange vraiment. J'ai fait une introduction aux statistiques, mais je ne pouvais tout simplement pas comprendre ce sujet de manière

22

Régression polynomiale brute ou orthogonale?

Je veux régresser une variable sur x , x 2 , … , x 5 . Dois-je le faire en utilisant des polynômes bruts ou orthogonaux? J'ai regardé la question sur le site qui traite de ces derniers, mais je ne comprends pas vraiment quelle est la différence entre les utiliser.

r regression polynomial

21

Comment projeter un nouveau vecteur sur l'espace PCA?

Après avoir effectué l'analyse des composants principaux (PCA), je souhaite projeter un nouveau vecteur sur l'espace PCA (c'est-à-dire trouver ses coordonnées dans le système de coordonnées PCA). J'ai calculé PCA en langage R en utilisant prcomp. Maintenant, je devrais pouvoir multiplier mon...

r pca r variance heteroscedasticity misspecification distributions time-series data-visualization modeling histogram kolmogorov-smirnov negative-binomial likelihood-ratio econometrics panel-data categorical-data scales survey distributions pdf histogram correlation algorithms r gpu parallel-computing approximation mean median references sample-size normality-assumption central-limit-theorem rule-of-thumb confidence-interval estimation mixed-model psychometrics random-effects-model hypothesis-testing sample-size dataset large-data regression standard-deviation variance approximation hypothesis-testing variance central-limit-theorem kernel-trick kernel-smoothing error sampling hypothesis-testing normality-assumption philosophical confidence-interval modeling model-selection experiment-design hypothesis-testing statistical-significance power asymptotics information-retrieval anova multiple-comparisons ancova classification clustering factor-analysis psychometrics r sampling expectation-maximization markov-process r data-visualization correlation regression statistical-significance degrees-of-freedom experiment-design r regression curve-fitting change-point loess machine-learning classification self-study monte-carlo markov-process references mathematical-statistics data-visualization python cart boosting regression classification robust cart survey binomial psychometrics likert psychology asymptotics multinomial

21

Distributions antérieures faiblement informatives pour les paramètres d'échelle

J'ai utilisé des distributions log normales comme distributions antérieures pour les paramètres d'échelle (pour les distributions normales, les distributions t, etc.) quand j'ai une idée approximative de ce que l'échelle devrait être, mais je veux me tromper en disant que je ne sais pas beaucoup à...

distributions bayesian modeling prior maximum-entropy

21

Comment utiliser les poids dans la fonction lm dans R?

Verrouillé . Cette question et ses réponses sont verrouillées car la question est hors sujet mais a une signification historique. Il n'accepte pas actuellement de nouvelles réponses ou interactions. Quelqu'un pourrait-il offrir des conseils sur la façon d'utiliser l' weightsargument dans la...

r regression

21

Pourquoi un avant sur la variance est-il considéré comme faible?

Contexte L'un des faibles a priori sur variance les plus couramment utilisés est le gamma inverse avec les paramètres (Gelman 2006) .α=0.001,β=0.001α=0.001,β=0.001\alpha =0.001, \beta=0.001 Cependant, cette distribution a un IC à 90% d'environ .[3×1019,∞][3×1019,∞][3\times10^{19},\infty]...

bayesian multilevel-analysis prior

21

Ajuster un modèle exponentiel aux données

Cette question a été migrée à partir de Stack Overflow car il est possible d'y répondre sur la validation croisée. Migré il y a 8 ans . J'ai 2 variables, toutes deux de la classe "numérique": > head(y) [1] 0.4651804 0.6185849 0.3766175 0.5489810 0.3695258 0.4002567 > head(x) [1] 59.32820...

r

21

Régression logistique des séries chronologiques

Je voudrais utiliser un modèle de régression logistique binaire dans le contexte des données en streaming (séries temporelles multidimensionnelles) afin de prédire la valeur de la variable dépendante des données (ie ligne) qui vient d'arriver, compte tenu des observations passées. Pour autant que...

r time-series logistic

21

Comment puis-je prédire des valeurs à partir de nouvelles entrées d'un modèle linéaire dans R?

Verrouillé . Cette question et ses réponses sont verrouillées car la question est hors sujet mais a une signification historique. Il n'accepte pas actuellement de nouvelles réponses ou interactions. J'ai créé un modèle linéaire R: mod = lm(train_y ~ train_x). Je veux lui passer une liste de X et...

r forecasting linear-model

21

Auto.arima avec des données quotidiennes: comment capturer la saisonnalité / périodicité?

Je monte un modèle ARIMA sur une série temporelle quotidienne. Les données sont collectées quotidiennement du 02-01-2010 au 30-07-2011 et concernent les ventes de journaux. Puisqu'une tendance hebdomadaire des ventes peut être trouvée (la quantité moyenne quotidienne d'exemplaires vendus est...

r time-series arima seasonality

21

Calcul efficace de l'inverse de la matrice dans R

J'ai besoin de calculer l'inverse de la matrice et j'ai utilisé la solvefonction. Bien qu'il fonctionne bien sur les petites matrices, il a solvetendance à être très lent sur les grandes matrices. Je me demandais s'il existe une autre fonction ou combinaison de fonctions (via SVD, QR, LU ou...

r matrix-decomposition matrix-inverse

21

Que signifie «impartialité»?

Que signifie dire que "la variance est un estimateur biaisé". Que signifie convertir une estimation biaisée en une estimation non biaisée au moyen d'une formule simple. Que fait exactement cette conversion? Aussi, quelle est l'utilité pratique de cette conversion? Convertissez-vous ces scores...

theory unbiased-estimator descriptive-statistics

21

Exemple de fort coefficient de corrélation avec une valeur p élevée

Je me demandais, est-il possible d'avoir un très fort coefficient de corrélation (disons .9 ou plus), avec une valeur p élevée (disons .25 ou plus)? Voici un exemple d'un faible coefficient de corrélation, avec une valeur p élevée: set.seed(10) y <- rnorm(100) x <- rnorm(100)+.1*y...

r hypothesis-testing correlation

21

Comment puis-je calculer la marge d'erreur dans un résultat NPS (Net Promoter Score)?

Je vais laisser Wikipedia expliquer comment le NPS est calculé: Le Net Promoter Score est obtenu en posant aux clients une seule question sur une échelle de 0 à 10, où 10 est «extrêmement probable» et 0 est «peu probable»: «Quelle est la probabilité que vous recommandiez notre entreprise à un ami...

hypothesis-testing statistical-significance standard-error multinomial nps

21

Régression vs écart ANOVA (aov vs lm dans R)

J'ai toujours eu l'impression que la régression n'est qu'une forme plus générale d'ANOVA et que les résultats seraient identiques. Récemment, cependant, j'ai effectué une régression et une ANOVA sur les mêmes données et les résultats diffèrent considérablement. Autrement dit, dans le modèle de...

r regression anova

21

Première étape pour les mégadonnées (

Supposons que vous analysez un énorme ensemble de données à hauteur de milliards d'observations par jour, où chaque observation comporte quelques milliers de variables numériques et catégorielles éparses et peut-être redondantes. Disons qu'il y a un problème de régression, un problème de...

r machine-learning data-mining large-data

21

Modèles empilables / assemblables avec caret

Je me retrouve souvent à former plusieurs modèles prédictifs différents en utilisant caretR. Je vais tous les former sur les mêmes plis de validation croisée, en utilisant caret::: createFolds, puis en choisissant le meilleur modèle basé sur une erreur de validation croisée. Cependant, la...

r caret ensemble

21

Diagnostics résiduels dans les modèles de régression basés sur MCMC

Je me suis récemment lancé dans l'ajustement de modèles mixtes de régression dans le cadre bayésien, en utilisant un algorithme MCMC (fonction MCMCglmm dans R en fait). Je crois avoir compris comment diagnostiquer la convergence du processus d'estimation (trace, tracé de geweke, autocorrélation,...

r bayesian mixed-model mcmc residuals

21

Rôle du paramètre n.minobsinnode de GBM dans R [fermé]

Il est peu probable que cette question aide les futurs visiteurs; il ne s'applique qu'à une petite zone géographique, à un moment précis ou à une situation extraordinairement étroite qui n'est généralement pas applicable au public mondial d'Internet. Pour obtenir de l'aide afin que cette question...

r gbm

21

Comment puis-je aligner / synchroniser deux signaux?

Je fais des recherches mais je suis resté bloqué au stade de l'analyse (j'aurais dû prêter plus d'attention à mes conférences de statistiques). J'ai collecté deux signaux simultanés: débit intégré pour le volume et changement d'expansion thoracique. J'aimerais comparer les signaux et j'espère...

r time-series signal-processing measurement