Questions marquées «errors-in-variables»

29

Comment gérer les données hiérarchiques / imbriquées dans l'apprentissage automatique

Je vais expliquer mon problème avec un exemple. Supposons que vous souhaitiez prédire le revenu d'un individu en fonction de certains attributs: {âge, sexe, pays, région, ville}. Vous avez un ensemble de données de formation comme ça train <- data.frame(CountryID=c(1,1,1,1, 2,2,2,2, 3,3,3,3),...

regression machine-learning multilevel-analysis correlation dataset spatial paired-comparisons cross-correlation clustering aic bic dependent-variable k-means mean standard-error measurement-error errors-in-variables regression multiple-regression pca linear-model dimensionality-reduction machine-learning neural-networks deep-learning conv-neural-network computer-vision clustering spss r weighted-data wilcoxon-signed-rank bayesian hierarchical-bayesian bugs stan distributions categorical-data variance ecology r survival regression r-squared descriptive-statistics cross-section maximum-likelihood factor-analysis likert r multiple-imputation propensity-scores distributions t-test logit probit z-test confidence-interval poisson-distribution deep-learning conv-neural-network residual-networks r survey wilcoxon-mann-whitney ranking kruskal-wallis bias loss-functions frequentist decision-theory risk machine-learning distributions normal-distribution multivariate-analysis inference dataset factor-analysis survey multilevel-analysis clinical-trials

15

Régression des erreurs dans les variables: est-il valable de regrouper les données de trois sites?

Récemment, un client est venu me voir pour faire une analyse bootstrap parce qu'un examinateur de la FDA a dit que la régression des erreurs dans les variables n'était pas valide car lors de la mise en commun des données des sites, l'analyse inclut la mise en commun des données de trois sites où...

regression errors-in-variables deming-regression pooling

15

Quelle est l'intuition derrière les échantillons échangeables sous l'hypothèse nulle?

Les tests de permutation (également appelés test de randomisation, test de re-randomisation ou test exact) sont très utiles et s'avèrent utiles lorsque l'hypothèse de distribution normale requise par exemple t-testn'est pas remplie et lorsque la transformation des valeurs par classement des un test...

hypothesis-testing permutation-test exchangeability r statistical-significance loess data-visualization normal-distribution pdf ggplot2 kernel-smoothing probability self-study expected-value normal-distribution prior correlation time-series regression heteroscedasticity estimation estimators fisher-information data-visualization repeated-measures binary-data panel-data mathematical-statistics coefficient-of-variation normal-distribution order-statistics regression machine-learning one-class probability estimators forecasting prediction validation finance measurement-error variance mean spatial monte-carlo data-visualization boxplot sampling uniform chi-squared goodness-of-fit probability mixture theory gaussian-mixture regression statistical-significance p-value bootstrap regression multicollinearity correlation r poisson-distribution survival regression categorical-data ordinal-data ordered-logit regression interaction time-series machine-learning forecasting cross-validation binomial multiple-comparisons simulation false-discovery-rate r clustering frequency wilcoxon-mann-whitney wilcoxon-signed-rank r svm t-test missing-data excel r numerical-integration r random-variable lme4-nlme mixed-model weighted-regression power-law errors-in-variables machine-learning classification entropy information-theory mutual-information

14

Que pouvez-vous faire lorsque vous avez des variables prédictives basées sur des moyennes de groupe avec différentes tailles d'échantillon?

Considérons un problème d'analyse de données classique où vous avez un résultat YiYiY_{i} et comment elle est liée à un certain nombre de facteurs prédictifs Xi1,...,XipXi1,...,XipX_{i1}, ..., X_{ip} . Le type d'application de base à l'esprit ici est que YiYiY_{i} est un résultat au niveau du...

regression measurement-error errors-in-variables

13

Méthodes d'ajustement d'un modèle «simple» d'erreur de mesure

Je recherche des méthodes qui peuvent être utilisées pour estimer le modèle d'erreur de mesure "OLS". yi=Yi+ey,iyi=Yi+ey,iy_{i}=Y_{i}+e_{y,i} xi=Xi+ex,ixi=Xi+ex,ix_{i}=X_{i}+e_{x,i} Yi=α+βXiYi=α+βXiY_{i}=\alpha + \beta X_{i} Où les erreurs sont normales indépendantes avec des variances inconnues et...

regression estimation errors-in-variables

13

Estimateur biaisé pour la régression obtenant de meilleurs résultats que celui non biaisé dans le modèle d'erreur dans les variables

Je travaille sur certaines données syntaxiques pour le modèle Error In Variable pour certaines recherches. Actuellement, j'ai une seule variable indépendante et je suppose que je connais la variance pour la vraie valeur de la variable dépendante. Donc, avec cette information, je peux obtenir un...

regression matlab unbiased-estimator errors-in-variables

8

Régression linéaire avec bruit de grenaille

Je cherche la bonne terminologie statistique pour décrire le problème suivant. Je veux caractériser un appareil électronique qui a une réponse linéaire Oui=β0+β1X+ ϵY=β0+β1X+ϵY = \beta_0 + \beta_1 X + \epsilon où ϵ ∼ N( 0 ,σ2r o)ϵ∼N(0,σro2)\epsilon \sim N(0,\sigma^2_{ro})est un terme dû au bruit de...

regression maximum-likelihood heteroscedasticity errors-in-variables

8

Erreur systématique / de mesure sur une régression linéaire

Supposons que j'ai un ensemble de données (xi,yi)(xi,yi){(x_i,y_i)} dans lequel l'incertitude des mesures (Δxi,Δyi)(Δxi,Δyi){(\Delta x_i,\Delta y_i)}(qui proviennent de la propagation d'erreurs systématiques de l'appareil de mesure) est différent pour chaque point. Si je fais une régression...

linear-model measurement-error errors-in-variables

8

Approche de la fonction de contrôle et Bootstrap

Commençons par supposer que j'ai des données transversales sur , , (voir ci-dessous pour y , x_1 , x_2 ).yyyX1X1x_1X2X2x_2yyyX1X1x_1X2X2x_2 Je veux estimer l'effet des variables X1X1x_1 et X2X2x_2 et leur interaction ( X3=X1∗X2X3=X1∗X2x_3= x_1*x_2 ) sur la variable yyy utilisant l'approche de la...

econometrics bootstrap instrumental-variables resampling errors-in-variables