Statistiques et Big Data

24
F1 / Dice-Score vs IoU

J'étais confus quant aux différences entre le score F1, le score Dice et IoU (intersection sur l'union). À ce jour, j'ai découvert que F1 et Dice signifient la même chose (non?) Et IoU a une formule très similaire aux deux autres. F1 / Dés:2 TP2 TP+ FP+ FN2TP2TP+FP+FN\frac{2TP}{2TP+FP+FN} IoU /...

23
Forensics statistiques: Benford et au-delà

Quelles méthodes générales existe-t-il pour détecter la fraude, les anomalies, les falsifications, etc. dans les travaux scientifiques produits par un tiers? (J'étais motivé à le demander par la récente affaire Marc Hauser .) Habituellement, pour les fraudes électorales et comptables, une variante...

23
Quelle est la différence entre l'ACP et l'ACP asymptotique?

Dans deux articles en 1986 et 1988 , Connor et Korajczyk ont ​​proposé une approche pour modéliser les rendements des actifs. Étant donné que ces séries chronologiques ont généralement plus d'actifs que les observations de période, ils ont proposé d'effectuer une ACP sur les covariances...

23
Pourquoi briser le dénominateur du théorème de Bayes?

(Je suis un débutant dans les statistiques. Je suis mathématicien et programmeur et j'essaie de créer quelque chose comme un filtre anti-spam bayésien naïf.) J'ai remarqué à de nombreux endroits que les gens ont tendance à briser le dénominateur dans l'équation du théorème de Bayes. Donc au lieu de...

23
Estimation d'une distribution basée sur trois centiles

Quelles méthodes puis-je utiliser pour déduire une distribution si je ne connais que trois centiles? Par exemple, je sais que dans un certain ensemble de données, le cinquième centile est 8 135, le 50e centile est 11 259 et le 95e centile est 23 611. Je veux pouvoir passer d'un autre nombre à son...

23
Réglage des nœuds dans les splines cubiques naturelles en R

J'ai des données avec de nombreuses fonctionnalités corrélées, et je veux commencer par réduire les fonctionnalités avec une fonction de base fluide, avant d'exécuter un LDA. J'essaie d'utiliser des splines cubiques naturelles dans le splinespackage avec la nsfonction. Comment dois-je procéder pour...

23
Bibliothèques C ++ pour le calcul statistique

J'ai un algorithme MCMC particulier que je voudrais porter en C / C ++. Une grande partie du calcul coûteux est déjà en C via Cython, mais je veux que l'échantillonneur entier soit écrit dans un langage compilé afin que je puisse simplement écrire des wrappers pour Python / R / Matlab / peu...