Analyse invariante d'échelle des séries chronologiques

8

Lors du développement d'un logiciel de séries chronologiques à usage général, est-ce une bonne idée de le rendre invariant à l'échelle? Comment ferait-on cela?

J'ai pris une série chronologique d'environ 40 points, puis multipliée par des facteurs allant de 10E-9 à 10E3, puis j'ai parcouru les fonctions ARIMA de Forecast Pro et Minitab. Dans Forecast Pro, tous aboutissaient à la même réponse (modélisation automatique), alors que dans Minitab, ils ne l'étaient pas. Je ne sais pas ce que fait Forecast Pro, mais ils peuvent simplement augmenter ou réduire tous les nombres à une certaine échelle (disons 100) avant d'exécuter le modèle. Est-ce une bonne idée en général?

Samik R
la source

Réponses:

7

Si le logiciel calcule la somme des erreurs quadratiques dans l'optimisation (et la plupart le feront), vous pouvez rencontrer des problèmes avec des nombres très grands ou très petits en raison de la façon dont les nombres à virgule flottante sont stockés. La même chose s'applique à toute modélisation statistique, pas seulement à l'analyse de séries chronologiques. Une façon d'éviter le problème est de mettre à l'échelle les données avant d'exécuter le modèle, puis de redimensionner les résultats. Pour la plupart des modèles de séries chronologiques, y compris tous les modèles linéaires, cela fonctionnera. Cependant, certains modèles non linéaires ne seront pas mis à l'échelle.

Lorsque j'analyse des données, je les redimensionne souvent moi-même, non seulement pour éviter d'éventuels problèmes d'optimisation, mais aussi pour faciliter la lecture des graphiques et des tableaux.

Rob Hyndman
la source
1
De plus, vous voudrez peut-être consulter ce que tout informaticien devrait savoir sur l'arithmétique à virgule flottante, par David Goldberg, pour obtenir des conseils sur la façon de traiter les problèmes de représentation numérique.
fmark
@Rob: Merci pour la réponse. Je suppose que vous sous-entendez alors qu'il est correct de mettre la série à l'échelle avant de faire l'analyse.
Samik R
@fmark: Merci pour le commentaire - je connais assez bien ce matériel.
Samik R
@Samik: Pour les modèles linéaires tels que les processus ARIMA gaussiens, oui.
Rob Hyndman
3
Dans de vastes limites, la mise à l'échelle ne fait aucune différence pour les calculs en virgule flottante: elle équivaut simplement à un décalage d'exposant sans perte de précision. Lorsque la mise à l'échelle peut être utile, c'est lorsqu'un calcul implique des ensembles de données qui sont eux-mêmes à différentes échelles. Je suppose que les formules de séries chronologiques utilisent une mesure du temps (millisecondes? Années? Simplement des étapes intégrales?) Qui peut avoir une plage très différente de la plage des données. Bonnes statistiques SW adaptera ses matrices en interne pour éviter toute perte de précision; cela pourrait expliquer les différences entre FP et Minitab.
whuber