Statistiques et Big Data

9
Intuition d'une entropie articulaire

J'ai du mal à construire une intuition sur l'entropie conjointe. = incertitude dans la distribution conjointe ; = incertitude dans ; = incertitude dans .H(X,Y)H(X,Y)H(X,Y)p(x,y)p(x,y)p(x,y)H(X)H(X)H(X)px(x)px(x)p_x(x)H(Y)H(Y)H(Y)py(y)py(y)p_y(y) Si H (X) est élevé, alors la distribution est plus...

9
Valeur de coupure de distance du cuisinier

J'ai lu sur la distance du cuisinier pour identifier les valeurs aberrantes qui ont une grande influence sur ma régression. Dans l'étude originale de Cook, il dit qu'un taux de coupure de 1 devrait être comparable pour identifier les influenceurs. Cependant, diverses autres études utilisent...

9
Biais d'optimisme - estimations de l'erreur de prédiction

Le livre Elements of Statistical Learning (disponible en ligne en PDF) discute du biais d'optimisim (7.21, page 229). Il indique que le biais d'optimisme est la différence entre l'erreur d'apprentissage et l'erreur dans l'échantillon (erreur observée si nous échantillonnons de nouvelles valeurs de...