L'erreur moyenne à l'échelle absolue (MASE) est une mesure de la précision des prévisions proposée par Koehler et Hyndman (2006) .
où est l'erreur absolue moyenne produite par la prévision réelle;
tandis que M A E i n - s a m p l e ,
est l'erreur absolue moyenne produite par une prévision naïve (par exemple, une prévision sans changement pour unesérie chronologiqueI(1)intégrée), calculée sur les données de l'échantillon.
(Consultez l'article de Koehler & Hyndman (2006) pour une définition et une formule précises.)
implique que la prévision réelle estpirehors échantillon qu'une prévision naïve dans l'échantillon, en termes d'erreur absolue moyenne. Ainsi, si l'erreur absolue moyenne est la mesure pertinente de l'exactitude des prévisions (qui dépend du problème en question), M A S E > 1 suggère que la prévision réelle soit rejetée au profit d'une prévision naïvesi nous nous attendons à ce que les données d'échantillon doivent être très similaires aux données de l'échantillon(car nous savons seulement dans quelle mesure une prévision naïve a fonctionné dans l'échantillon, pas hors échantillon).
Question:
été utilisé comme référence dans un concours de prévisions proposé dans cebillet de blog Hyndsight. Un repère évident n'aurait-il pas dû être M A S E = 1 ?
Bien sûr, cette question n'est pas spécifique à la compétition de prévision particulière. J'aimerais avoir de l'aide pour comprendre cela dans un contexte plus général.
Ma conjecture:
La seule explication sensée que je vois est qu'une prévision naïve devrait faire bien pire hors échantillon qu'elle ne l'a fait dans l'échantillon, par exemple en raison d'un changement structurel. Alors aurait pu être trop difficile à réaliser.
Les références:
- Hyndman, Rob J. et Anne B. Koehler. " Un autre regard sur les mesures de l'exactitude des prévisions. " Journal international de prévision 22.4 (2006): 679-688.
- Article de blog Hyndsight .
la source
Réponses:
Dans l' article de blog lié , Rob Hyndman lance un appel à candidatures pour un concours de prévisions touristiques. Essentiellement, l'article de blog sert à attirer l'attention sur l' article pertinent de l' IJF , dont une version non fermée est liée à l'article de blog.
Les références auxquelles vous faites référence - 1,38 pour les données mensuelles, 1,43 pour les données trimestrielles et 2,28 pour les données annuelles - ont apparemment été établies comme suit. Les auteurs (tous sont des prévisionnistes experts et très actifs dans le IIF - pas de vendeurs d'huile de serpent ici) sont tout à fait capables d'appliquer des algorithmes de prévision standard ou des logiciels de prévision, et ils ne sont probablement pas intéressés par une simple soumission ARIMA. Ils sont donc allés appliquer des méthodes standard à leurs données. Pour que la soumission gagnante soit invitée à un article dans la FIJ , ils demandent qu'elle s'améliore sur les meilleures de ces méthodes standard, telles que mesurées par le MASE.
Votre question se résume donc essentiellement à:
Ici, le 1.38 MASE provient du tableau 4 dans la version non fermée. Il s'agit de l'ASE moyenne sur 1-2 à 24 mois des prévisions d'ARIMA. Les autres méthodes standard, comme ForecastPro, ETS, etc. fonctionnent encore moins bien.
Je dirais donc que vous ne pouvez probablement pas dire grand-chose à ce sujet sans regarder les données elles-mêmes. Ils sont disponibles sur Kaggle. Votre meilleur pari est susceptible de prendre ces 518 séries, de tenir les 24 derniers mois, d'ajuster les séries ARIMA, de calculer les MASE, de creuser les dix ou vingt séries de prévisions les moins bonnes pour MASE, de prendre une grosse tasse de café, de regarder ces séries et d'essayer pour comprendre ce qui rend les modèles ARIMA si mauvais pour les prévoir.
EDIT: un autre point qui semble évident après coup mais qui m'a pris cinq jours à voir - rappelez-vous que le dénominateur du MASE est la prévision de marche aléatoire dans l'échantillon avec une longueur d'avance , tandis que le numérateur est la moyenne des 1-24- anticiper les prévisions. Il n'est pas trop surprenant que les prévisions se détériorent avec des horizons croissants, donc cela peut être une autre raison pour un MASE de 1,38. Notez que la prévision saisonnière naïve était également incluse dans l'indice de référence et avait un MASE encore plus élevé.
la source
Pas une réponse, mais un complot suite à l'appel de Stephan Kolassa à "regarder ces séries".
Kaggle tourism1 a 518 séries chronologiques annuelles, pour lesquelles nous voulons prédire les 4 dernières valeurs:
Les nombres dans les coins, 81 12 ..., sont
Les 3 rangées sont les 10 pires, 10 au milieu et 10 meilleures de 518 séries chronologiques annuelles.
Évidemment, les séries très courtes - 12 11 7 7 7 ... dans la rangée du haut - sont difficiles à prévoir: pas de surprise.
(Athanasopoulos, Hyndman, Song et Wu, le concours de prévisions touristiques (2011, 23p) a utilisé 112 des 518 séries annuelles, mais je ne vois pas lesquelles.)
Existe-t-il d'autres collections de séries chronologiques plus récentes depuis 2010, qui méritent d'être examinées?
la source