Je voudrais créer un système d'apprentissage automatique en ligne sur le Web, où les utilisateurs peuvent continuellement ajouter des échantillons classifiés et mettre le modèle à jour en ligne. Je souhaite utiliser un perceptron ou un algorithme d'apprentissage en ligne similaire.
Mais, les utilisateurs peuvent faire des erreurs et insérer des exemples non pertinents. Dans ce cas, j'aimerais avoir la possibilité de supprimer un exemple spécifique, sans réentraîner le perceptron sur l'ensemble des exemples (qui peuvent être très volumineux).
Est-ce possible?
machine-learning
online-algorithms
Erel Segal-Halevi
la source
la source
Réponses:
Si je comprends bien le processus , il est impossible de modifier un perceptron sans recyclage. Les ajustements de poids ne sont pas seulement relatifs à cet exemple spécifique mais également aux autres exemples d'entraînement qui ont précédé. Identifier l'instance incorrectement classée et la supprimer de l'ensemble de test avant de recycler le modèle semble être le moyen le plus efficace de corriger les pondérations.
Je pense qu'il convient de souligner qu'en comparaison avec d'autres algorithmes d'apprentissage automatique, les perceptrons sont relativement résistants au bruit et aux instances incorrectement classées dans l'ensemble de formation . Si vous rencontrez un grand nombre d'instances mal classées, il semble plus prudent d'avoir une meilleure validation au moment où vous ingérez les données avant la formation que de trouver un moyen de corriger les instances mal classées après que le perceptron a été formé. Si ce n'est pas possible et que vous êtes en mesure d'identifier les instances incorrectement classées en tant que telles, leur suppression et leur recyclage semblent être le seul moyen de supprimer efficacement l'impact des instances mal classées.
la source