Questions marquées «errors-in-variables»

29
Comment gérer les données hiérarchiques / imbriquées dans l'apprentissage automatique

Je vais expliquer mon problème avec un exemple. Supposons que vous souhaitiez prédire le revenu d'un individu en fonction de certains attributs: {âge, sexe, pays, région, ville}. Vous avez un ensemble de données de formation comme ça train <- data.frame(CountryID=c(1,1,1,1, 2,2,2,2, 3,3,3,3),...

15
Quelle est l'intuition derrière les échantillons échangeables sous l'hypothèse nulle?

Les tests de permutation (également appelés test de randomisation, test de re-randomisation ou test exact) sont très utiles et s'avèrent utiles lorsque l'hypothèse de distribution normale requise par exemple t-testn'est pas remplie et lorsque la transformation des valeurs par classement des un test...

14
Que pouvez-vous faire lorsque vous avez des variables prédictives basées sur des moyennes de groupe avec différentes tailles d'échantillon?

Considérons un problème d'analyse de données classique où vous avez un résultat YiYiY_{i} et comment elle est liée à un certain nombre de facteurs prédictifs Xi1,...,XipXi1,...,XipX_{i1}, ..., X_{ip} . Le type d'application de base à l'esprit ici est que YiYiY_{i} est un résultat au niveau du...

13
Estimateur biaisé pour la régression obtenant de meilleurs résultats que celui non biaisé dans le modèle d'erreur dans les variables

Je travaille sur certaines données syntaxiques pour le modèle Error In Variable pour certaines recherches. Actuellement, j'ai une seule variable indépendante et je suppose que je connais la variance pour la vraie valeur de la variable dépendante. Donc, avec cette information, je peux obtenir un...