Statistiques et Big Data

24
Algorithme pour surveiller dynamiquement les quantiles

Je veux estimer le quantile de certaines données. Les données sont si énormes qu'elles ne peuvent pas être stockées dans la mémoire. Et les données ne sont pas statiques, de nouvelles données continuent d'arriver. Quelqu'un connaît-il un algorithme pour surveiller les quantiles des données...

24
Avez-vous une vision globale de ces techniques d'analyse?

Je suis actuellement sur un projet où j'ai essentiellement besoin, comme nous tous, de comprendre comment la sortie est liée à l'entrée . La particularité ici est que les données me sont données une pièce à la fois, donc je veux mettre à jour mon analyse chaque fois que je reçois une nouvelle . Je...

24
Qui a inventé la validation croisée k-fold?

Je cherche une référence à l'article où la validation croisée k-fold a été introduite (plutôt qu'une simple bonne référence académique pour le sujet). Il est peut-être trop loin dans la nuit des temps pour identifier sans ambiguïté le tout premier article, de sorte que tous les premiers articles où...

24
Corrélation entre deux séries chronologiques

Quelle est la méthode / méthode la plus simple pour calculer la corrélation entre deux séries chronologiques qui ont exactement la même taille? J'ai pensé multiplier et , et additionner la multiplication. Donc, si ce nombre unique était positif, peut-on dire que ces deux séries sont corrélées? Je...