Statistiques et Big Data

24
Passer de la modélisation d'un processus à l'aide d'une distribution de Poisson pour utiliser une distribution binomiale négative?

\newcommand{\P}{\mathbb{P}} Nous avons un processus aléatoire qui peut ou mai ne pas se produire plusieurs fois dans une période de temps définie . Nous avons un flux de données à partir d'un modèle préexistant de ce processus, qui fournit la probabilité qu'un certain nombre d'événements se...

24
Quelle est la différence entre abandon et drop connect?

Quelle est la différence entre abandon et drop connect? AFAIK, le décrochage supprime aléatoirement les nœuds cachés pendant la formation, mais les maintient dans les tests, et le drop connect supprime les connexions. Mais la suppression des connexions n'est-elle pas équivalente à la suppression...

24
Pourquoi les corrections d'hypothèses multiples ne sont-elles pas appliquées à toutes les expériences depuis la nuit des temps?

Nous savons que nous devons appliquer des corrections de type Benjamini Hochberg pour les tests d'hypothèses multiples aux expériences basées sur un seul ensemble de données, afin de contrôler le taux de fausses découvertes, sinon toutes les expériences qui donnent un résultat positif pourraient...

24
L'heure est-elle une variable catégorielle?

"Heure du jour" où la valeur peut être 0, 1, 2, ..., 23 est-elle une variable catégorielle? Je serais tenté de dire non, car 5, par exemple, est «plus proche» de 4 ou 6 que de 3 ou 7. Par contre, il y a la discontinuité entre 23 et 0. Est-ce donc généralement considéré comme catégorique ou non?...

24
Qui a inventé l'arbre de décision?

J'essaie de retracer qui a inventé la structure et l'algorithme des données de l'arbre de décision. Dans l'article de Wikipédia sur l' apprentissage de l'arbre de décision, il est affirmé que "ID3 et CART ont été inventés indépendamment à la même époque (entre 1970 et 1980)". ID3 a été présenté...