RNN utilisant plusieurs séries chronologiques

14

J'essaie de créer un réseau neuronal en utilisant des séries temporelles en entrée, afin de le former en fonction du type de chaque série. J'ai lu qu'en utilisant des RNN, vous pouvez diviser l'entrée en lots et utiliser chaque point de la série temporelle en neurones individuels et éventuellement former le réseau.

Ce que j'essaie de faire, c'est d'utiliser plusieurs séries temporelles comme entrée. Ainsi, par exemple, vous pouvez recevoir des entrées de deux capteurs. (Donc deux séries chronologiques), mais je veux les utiliser toutes les deux pour obtenir un résultat final.

De plus, je n'essaie pas de prédire les valeurs futures de la série chronologique, j'essaie d'obtenir une classification basée sur chacune d'elles.

Comment dois-je aborder ce problème?

  • Existe-t-il un moyen d'utiliser plusieurs séries temporelles comme entrée d'un RNN?

  • Dois-je essayer d'agréger les séries chronologiques en une seule?

  • Ou devrais-je simplement utiliser deux réseaux de neurones différents? Et si cette dernière approche est correcte, si le nombre de séries chronologiques augmente, cela ne serait-il pas trop gourmand en informatique?

Ploo
la source

Réponses:

10

Les séries chronologiques multivariées sont un sujet de recherche actif, vous trouverez de nombreux articles récents sur le sujet.

Pour répondre à vos questions, vous pouvez utiliser un seul RNN. Vous pouvez entrer une valeur pour chaque pas de temps. Rien ne vous empêche d'ajouter une autre valeur à chaque pas de temps (si votre capteur est synchronisé). Votre modèle apprendra ensuite à classer avec une série chronologique bidimensionnelle.

Vous consultez ce blog . Dans votre cas, seule la sortie est différente.

Quant aux deux derniers points, l'agrégation des séries chronologiques en un seul est risquée dans le sens où vous risquez de perdre des informations importantes au cours du processus. Enfin, le principal inconvénient de votre dernier point est que vous ne pourrez pas utiliser une corrélation potentielle entre les deux séries chronologiques pour le classement final.

Daerken
la source
Si vous utilisez plusieurs séries chronologiques, comment le réseau réagira-t-il si, pour une raison quelconque, pour l'échantillon1, vous en avez 5, mais pour l'échantillon2, vous en avez 4 (peut-être parce que vous n'avez pas de données du dernier capteur). Est-il nécessaire que si vous commencez avec une série 5, elle devrait toujours être 5? Devriez-vous inclure une 5e série chronologique pour sample2 avec de fausses données moyennes pour que j'aie les 5?
Ploo
1
eh bien, il existe différentes approches pour les données manquantes. Je vous recommanderais d'utiliser la valeur 0 lorsque vous n'avez aucune valeur. Il est souvent utilisé lorsque nous n'avons pas toute la séquence X_t mais nous devons quand même saisir une séquence de longueur t. Il s'agit du rembourrage si vous souhaitez en savoir plus.
Daerken