Statistiques et Big Data

9
Déterminer le plus grand contributeur d'un groupe

Je ne connais pas grand-chose aux statistiques, alors restez avec moi. Disons que j'ai un ensemble de 1000 travailleurs. Je veux savoir qui est le travailleur le plus acharné, mais je ne peux mesurer que la quantité de travail effectuée en groupes de 1 à 100 personnes sur une heure de travail. En...

9
Distributions sur des sous-ensembles de

Je me demande s'il y a toutes sortes de distributions standard sur des sous - ensembles d'entiers {1,2,...,J}{1,2,...,J}\{1, 2, ..., J\} . De manière équivalente, nous pourrions exprimer cela comme une distribution sur un vecteur de longueur JJJ de résultats binaires, par exemple si J=5J=5J = 5...

9
Comment expliquer l'intuition derrière l'ANOVA?

Je dois expliquer l'intuition derrière ce que fait l'ANOVA à une personne non technique. Y a-t-il un visuel qui explique l'idée? Un visuel qui illustre l'idée clé dans le contexte d'une ANOVA unidirectionnelle avec peut-être 3 niveaux de facteur pourrait être utile? Supposons que la personne ait...

9
D'où vient la fonction gaussienne?

J'ai lu d'innombrables pages sur Google et je ne trouve pas de réponse satisfaisante. J'ai également lu http://castatistics.wikispaces.com/file/view/normal+der..pdf , mais je doute que c'était la motivation d'origine de la fonction gaussienne. Je suis actuellement étudiant de premier cycle et mon...

9
Confusion liée à la technique d'ensachage

J'ai un peu de confusion. Je lisais cet article où il expliquait que la technique d'ensachage réduit considérablement la variance et n'augmente que légèrement le biais. Je ne l'ai pas compris comment cela réduit la variance. Je sais ce qu'est la variance et le biais. Le biais est l'incapacité du...