Questions marquées «cross-section»

29
Comment gérer les données hiérarchiques / imbriquées dans l'apprentissage automatique

Je vais expliquer mon problème avec un exemple. Supposons que vous souhaitiez prédire le revenu d'un individu en fonction de certains attributs: {âge, sexe, pays, région, ville}. Vous avez un ensemble de données de formation comme ça train <- data.frame(CountryID=c(1,1,1,1, 2,2,2,2, 3,3,3,3),...

11
Pourquoi l'utilisation de données transversales pour déduire / prédire des changements longitudinaux est-elle une mauvaise chose?

Je cherche un papier qui j'espère existe, mais je ne sais pas si c'est le cas. Il pourrait s'agir d'un ensemble d'études de cas et / ou d'un argument de la théorie des probabilités expliquant pourquoi l'utilisation de données transversales pour déduire / prédire des changements longitudinaux peut...

8
Si vous exécutez une régression OLS sur des données transversales, devez-vous tester l'autocorrélation dans les résidus?

J'ai un ensemble d'observations, indépendant du temps. Je me demande si je dois exécuter des tests d'autocorrélation? Il me semble que cela n'a aucun sens, car il n'y a pas de composante temporelle dans mes données. Cependant, j'ai en fait essayé le test LM de corrélation en série, et cela indique...