Statistiques et Big Data

12
Comment trouver la variance entre des points multidimensionnels?

Supposons que j'ai une matrice X qui est n par p, c'est-à-dire qu'elle a n observations, avec chaque observation dans l'espace p-dimensionnel. Comment trouver la variance de ces n observations? Dans le cas où p = 1, il me suffit d'utiliser la formule de variance régulière. Qu'en est-il des cas où...

12
Courbe ROC traversant la diagonale

J'utilise actuellement un classificateur binaire. Lorsque je trace la courbe ROC, j'obtiens une bonne portance au début, puis elle change de direction et traverse la diagonale, puis bien sûr en remontant, faisant de la courbe une forme inclinée en S. Quelle peut être une interprétation /...

12
Le chiffre 20 est-il magique?

J'ai des références qui ont conseillé d'envisager une taille d'échantillon d'au moins 20 pour la distribution de l'ajustement des données. Y a-t-il un sens à cela?