Techniques d'apprentissage incrémentiel en ligne du classificateur sur les données de flux

9

Quelles sont les bonnes techniques pour faire face à ce problème abstrait?

Vous disposez d'un flux de données d'un signal continu, comme celui d'un capteur physique. Ce signal a des valeurs réelles (discrétisées), aucun attribut; des caractéristiques de dépendance (p. ex. puissance, auto-corrélation, entropie) pourraient être extraites. Vous pouvez affecter une étiquette d'un ensemble fini à une fenêtre du signal. Que cette étiquette soit une étiquette de formation . Vous devez choisir les points de début et de fin de la fenêtre ainsi que le libellé de la fenêtre.

La tâche consiste à classer les fenêtres suivantes en ligne, dès que le signal est reçu.

Je demande un algorithme incrémental, dans le sens où il devrait augmenter ses performances de détection avec plus d'étiquettes de formation. Mais il doit pouvoir classer même après un seul label de formation.

Si le problème s'avère trop difficile à cause de la détection des limites des fenêtres, disons que vous pouvez fixer leur taille à une petite constante. Ainsi, l'algorithme classe les petites tranches du signal, puis il fusionne les tranches adjacentes avec les mêmes étiquettes. Si vous utilisez cette approche simplifiée, veuillez justifier pourquoi elle est raisonnable.

stackovergio
la source

Réponses:

2

S'il s'agit d'un problème de classification binaire, il devrait être possible d'appliquer un SVM en ligne tel que Bordes, A. et Bottou, L. , "The Huller: a simple and efficient online SVM", ECML 2005 .

S'il s'agit d'une classification non binaire (c'est-à-dire plus de 2 étiquettes possibles), vous pouvez examiner les techniques de moindres carrés récursifs du noyau. Ils sont faits pour la régression en ligne, mais ils fonctionnent également assez bien pour la classification en ligne. Voici un algorithme de base de KRLS: Y. Engel, S. Mannor et R. Meir , "The Kernel Recusrive Least Squares Algorithm", IEEE Trans. Traitement du signal, 2004 .

Ces deux approches nécessiteront des tailles de fenêtre fixes afin de comparer des vecteurs d'entrée de même taille.

Steven
la source