Je travaille actuellement sur une tâche de prévision de la demande, avec des données sur des dizaines de milliers de produits dans quelques milliers de magasins. Plus précisément, j'ai quelques années de données de ventes quotidiennes par produit dans chaque magasin, et mon objectif est de prévoir les ventes futures de chaque article dans chaque magasin, un jour à l'avance; puis deux jours à l'avance, etc.
Jusqu'à présent, j'ai envisagé de diviser chaque paire de produits-magasins en une seule série chronologique et de faire une prévision pour chaque série chronologique comme cela a été fait dans l'article de Neal Wagner, Techniques intelligentes pour prévoir plusieurs séries chronologiques dans des systèmes du monde réel . En d'autres termes, je n'utiliserai que les informations historiques des ventes du produit d'un magasin particulier pour prévoir les ventes futures de ce produit dans ce magasin.
Cependant, j'ai parcouru Kaggle et des compétitions comme Corporación Favorita Grocery Sales Forecasting suggèrent une approche différente, qui consiste à utiliser les informations de tous les magasins et de tous les produits pour prédire les ventes futures. Si je comprends bien, les informations historiques sur les ventes de tous les produits dans tous les magasins sont transférées dans l'ensemble de formation, à partir duquel le modèle apprendra à prévoir les ventes futures. C'est très différent des méthodes traditionnelles de séries chronologiques, mais apparemment, selon les résultats de la compétition, cela fonctionne.
Cette dernière méthode semble prometteuse et plus robuste. Cependant, il y a le problème d'avoir à traiter des centaines de millions de points de données.
Quelle méthode est la plus appropriée pour ma tâche? Pour ceux qui ont travaillé sur des problèmes similaires, quelle méthodologie recommanderiez-vous?
Réponses:
Je ne recommanderais pas l'approche utilisée par Neal et al. . Leurs données sont uniques pour deux raisons:
Ils travaillent avec des données sur les aliments, qui sont généralement plus denses et plus stables que les autres données sur les ventes au détail de produits. Un emplacement donné vendra des dizaines de cartons de lait ou de paquets d'œufs par semaine et vendra ces mêmes produits depuis des décennies, par rapport à la mode ou aux pièces automobiles où il n'est pas inhabituel de vendre un seul article toutes les 3 ou 4 semaines, et les données ne sont disponibles que pour un an ou deux.
Ils prévoient des entrepôts et non des magasins. Un seul entrepôt couvre plusieurs magasins, de sorte que leurs données sont encore plus denses que la moyenne. En fait, un entrepôt est généralement utilisé comme niveau d'agrégation / de regroupement naturel pour les magasins, de sorte qu'ils effectuent déjà essentiellement un regroupement des données du magasin.
En raison de la nature de leurs données, ils peuvent se passer directement de la modélisation de séries chronologiques individuelles. Mais les données de la plupart des détaillants seraient trop clairsemées au niveau de chaque sku / magasin pour qu'ils puissent retirer cela.
Comme l'a dit zbicycliste, ce problème est généralement abordé à l'aide de prévisions hiérarchiques ou multi-échelons . Les packages de prévision de la demande commerciale utilisent tous une forme de prévision hiérarchique
L'idée est de regrouper les produits et les magasins dans des produits et des régions similaires, pour lesquels des prévisions agrégées sont générées et utilisées pour déterminer la saisonnalité et la tendance globales, qui sont ensuite réparties réconciliées en utilisant une approche descendante avec les prévisions de base générées pour chaque référence individuelle. / combinaison de magasin.
Outre le défi que zbicycliste a mentionné, un problème plus important est que trouver les regroupements optimaux de produits et de magasins n'est pas une tâche triviale, qui nécessite une combinaison d'expertise de domaine et d'analyse empirique. Les produits et les magasins sont généralement regroupés dans des hiérarchies élaborées (par département, fournisseur, marque, etc. pour les produits, par région, climat, entrepôt, etc. pour l'emplacement) qui sont ensuite transmises à l'algorithme de prévision avec les ventes historiques les données elles-mêmes.
Répondre aux commentaires meraxes
Ils effectuent le regroupement implicitement en utilisant magasin, article, famille, classe, cluster comme fonctionnalités catégorielles.
Trois points à ce sujet:
la source