Statistiques et Big Data

12
Qu'est-ce qu'un bon indice du degré de violation de la normalité et quelles étiquettes descriptives pourraient être attachées à cet indice?

Le contexte: Dans une question précédente, @Robbie a demandé dans une étude portant sur environ 600 cas pourquoi les tests de normalité suggéraient une non-normalité significative alors que les graphiques suggéraient des distributions normales . Plusieurs personnes ont souligné que les tests de...

12
Estimateur d'une distribution binomiale

Comment définir un estimateur pour les données provenant d'une distribution binomiale? Pour bernoulli je peux penser à un estimateur estimant un paramètre p, mais pour le binôme je ne vois pas quels paramètres estimer quand on a n caractérisant la distribution? Mise à jour: Par estimateur,...

12
Lecture de seulement deux colonnes sur trois avec read.csv

Verrouillé . Cette question et ses réponses sont verrouillées car la question est hors sujet mais a une signification historique. Il n'accepte pas actuellement de nouvelles réponses ou interactions. J'ai un ensemble de données ascii qui se compose de trois colonnes, mais seules les deux dernières...

12
Modification du lasso pour LARS

J'essaie de comprendre comment l'algorithme Lars peut être modifié pour générer Lasso. Bien que je comprenne le LARS, je ne suis pas en mesure de voir la modification au Lasso de l'article de Tibshirani et al. En particulier, je ne vois pas pourquoi la condition de signe en ce que le signe de la...