Statistiques et Big Data

27
Le blanchiment est-il toujours bon?

Une étape de prétraitement courante pour les algorithmes d'apprentissage automatique est le blanchiment des données. Il semble qu'il soit toujours bon de faire du blanchiment car il corréle les données, ce qui le rend plus simple à modéliser. Quand le blanchiment n'est-il pas recommandé? Remarque:...

27
Détection des valeurs aberrantes à l'aide des écarts-types

Suite à ma question ici , je me demande s'il existe des opinions bien arrêtées pour ou contre l'utilisation de l'écart-type pour détecter les valeurs aberrantes (par exemple, tout point de données supérieur à 2 écarts-types est une valeur aberrante). Je sais que cela dépend du contexte de l'étude,...

27
Dans un modèle à plusieurs niveaux, quelles sont les implications pratiques de l'estimation et de la non-estimation des paramètres de corrélation à effet aléatoire?

Dans un modèle à plusieurs niveaux, quelles sont les implications pratiques et liées à l'interprétation de l'estimation et de la non-estimation des paramètres de corrélation à effet aléatoire? La raison pratique de demander ceci est que dans le cadre de lmer dans R, il n'y a pas de méthode...