Analyse de séries chronologiques vs apprentissage automatique?

10

Juste une question générale. Si vous avez des données de séries chronologiques, quand est-il préférable d'utiliser des techniques de séries chronologiques (aka, ARCH, GARCH, etc.) plutôt que des techniques d'apprentissage machine / statistique (KNN, régression)? S'il y a une question similaire qui existe sur la validation croisée, veuillez m'orienter vers elle - elle a regardé et n'a pas pu en trouver une.

Nagy
la source
1
Pertinent: cs.stackexchange.com/questions/13937/…
Anton Tarasenko

Réponses:

9

Les méthodes typiques d'apprentissage automatique supposent que vos données sont indépendantes et distribuées de manière identique, ce qui n'est pas vrai pour les données de séries chronologiques. Ils sont donc désavantagés par rapport aux techniques de séries chronologiques, en termes de précision. Pour des exemples de cela, voir les questions précédentes Ordre des séries chronologiques pour l'apprentissage automatique et la forêt aléatoire est trop adaptée .

Tom Minka
la source
Merci pour votre réponse. Pour approfondir votre argument, il semble que l'apprentissage automatique se préoccupe davantage de trouver des relations dans les données, tandis que l'analyse des séries chronologiques se préoccupe davantage d'identifier correctement les causes des données - c'est-à-dire comment les facteurs stochastiques l'affectent. Es-tu d'accord avec ça?
Nagy
4
Non, je ne serais pas d'accord avec ce résumé.
Tom Minka
4

Francis Diebold a récemment publié "ML et métriques VI: une différence clé entre ML et TS Econometrics" sur son blog. J'en fournis une version abrégée, donc tout le mérite lui revient. (L'accent est mis en gras.)

L'apprentissage automatique statistique (ML) et l'économétrie des séries temporelles (TS) ont beaucoup en commun. Mais il y a aussi une différence intéressante: l'accent mis par ML sur la modélisation non paramétrique flexible de la non-linéarité conditionnelle moyenne ne joue pas un grand rôle dans TS. <...>

[T] Voici très peu de preuves d'une importante non-linéarité conditionnelle moyenne dans la dynamique stationnaire de covariance (décroissante, désaisonnalisée) de la plupart des séries chronologiques économiques. <...> En effet, je ne peux penser qu'à un seul type de non-linéarité moyenne conditionnelle qui est apparu comme important à plusieurs reprises pour (au moins certaines) séries chronologiques économiques: la dynamique de commutation de Markov de style Hamilton.

[Bien sûr, il y a un éléphant non linéaire dans la pièce: une dynamique de type GARCH de type Engle. Ils sont extrêmement importants en économétrie financière, et parfois aussi en macro-économétrie, mais ils concernent les écarts conditionnels, pas les moyens conditionnels.]

Donc, il n'y a fondamentalement que deux modèles non linéaires importants dans TS, et un seul d'entre eux parle de dynamique moyenne conditionnelle. Et surtout, ils sont tous deux très étroitement paramétriques, étroitement adaptés aux caractéristiques spécialisées des données économiques et financières.

Ainsi, la conclusion est:

ML met l'accent sur l'approximation des fonctions de moyenne conditionnelle non linéaires de manière non paramétrique très flexible. Cela s'avère doublement inutile dans TS: il n'y a tout simplement pas beaucoup de non-linéarité conditionnelle à se soucier, et quand il y en a parfois, il est généralement de nature hautement spécialisée, mieux approché de manière hautement spécialisée (étroitement paramétrique) .

Je recommande de lire l'intégralité du message original ici .

Richard Hardy
la source
+1. Je suis très d'accord avec cette réponse. Les méthodes ML typiques sont caractérisées par une modélisation non paramétrique et ont des hypothèses très détendues tandis que les modèles ARMA sont "étroitement paramétriques".
Digio
2

Comme l'a souligné @Tom Minka, la plupart des techniques ML supposent des entrées iid. Il existe cependant quelques solutions:

  1. On peut utiliser tous les échantillons de séries temporelles passées dans le système «Mémoire» comme un vecteur caractéristique, c'est-à-dire: x = [x (t-1), x (t-2), ... x (tM)]. Cependant, cela pose 2 problèmes: 1) en fonction de votre binning, vous pouvez avoir un énorme vecteur d'entités 2- certaines méthodes nécessitent que les entités du vecteur d'entités soient indépendantes, ce qui n'est pas le cas ici.

  2. Il existe de nombreuses techniques ML spécialement conçues pour ces données de séries chronologiques, par exemple les modèles de Markov cachés, qui ont été utilisés avec beaucoup de succès pour la détection de crises, le traitement de la parole, etc.

  3. Enfin, une approche que j'ai adoptée consiste à utiliser des techniques d'extraction de caractéristiques pour convertir un problème de régression dynamique (qui a l'élément temps) en un problème statique. Par exemple, l'approche en mode dynamique principal (PDM) mappe le vecteur d'entité passé en entrée ([x (t-1), x (t-2), ... x (tM)]) sur un vecteur statique ([v ( 1), v (2), .. v (L)]) en convoluant le passé avec un banc de filtres linéaires spécifique au système (les PDM), voir Marmarelis, livre 2004 ou Marmarelis, Vasilis Z. "Méthodologie de modélisation pour les systèmes physiologiques non linéaires . " Annales du génie biomédical 25.2 (1997): 239-251 ...

DankMasterDan
la source