La capacité de reconnaissance de formes des CNN est-elle limitée au traitement d'images?

21

Un réseau neuronal convolutif peut-il être utilisé pour la reconnaissance de formes dans un domaine problématique où il n'y a pas d'images préexistantes, par exemple en représentant graphiquement des données abstraites? Serait-ce toujours moins efficace?

Ce développeur dit que le développement actuel pourrait aller plus loin, mais pas s'il y a une limite en dehors de la reconnaissance d'image.

dynrepsys
la source
1
Je vois au moins deux questions ici. Comment pensez-vous de vous séparer? En outre, la question aurait une bien meilleure qualité si vous pouviez développer ce que vous avez recherché par rapport à la question du titre.
Eric Platon
@EricPlaton Resserré un peu. Ma principale question concerne la nature de la relation entre les CNN et les images. Quelle serait votre suggestion pour la deuxième question?
dynrepsys
Merci, la question me convient (bien que je doive supprimer ma réponse maintenant ~). Quant à la deuxième question, qu'en est-il de l'approche "quelle est la prise"? "Est-ce toujours moins efficace?" est toujours bien si quelqu'un peut trouver un contre-exemple.
Eric Platon
Par "Un réseau neuronal convolutif peut-il être utilisé pour la reconnaissance de formes dans un domaine problématique où il n'y a pas d'images préexistantes, par exemple en représentant graphiquement des données abstraites?" demandez-vous si nous pouvons représenter des données sous forme d'image et appliquer un CNN? Vous aimez lire un jeu de données de 100 entités et le représenter comme une image 10x10?
rcpinto

Réponses:

10

Les réseaux convolutifs (CNN) reposent sur une convolution mathématique (par exemple des convolutions 2D ou 3D), qui est couramment utilisée pour le traitement du signal. Les images sont un type de signal, et la convolution peut également être utilisée sur le son, les vibrations, etc. Ainsi, en principe, les CNN peuvent trouver des applications pour n'importe quel signal, et probablement plus.

En pratique, il existe déjà des travaux sur la PNL (comme mentionné par Matthew Graves), où certaines personnes traitent du texte avec des CNN plutôt que des réseaux récursifs. Certains autres travaux s'appliquent au traitement du son (aucune référence ici, mais j'ai encore un travail inédit en cours).


Contenu original: En réponse à la question du titre d'origine, qui a changé maintenant. Peut-être besoin de supprimer celui-ci .

La recherche sur les réseaux contradictoires (et connexes) montre que même les réseaux profonds peuvent facilement être dupés , les amenant à voir un chien (ou tout autre objet) dans ce qui semble être un bruit aléatoire quand un humain le regarde (l'article a des exemples clairs).

Un autre problème est le pouvoir de généralisation d'un réseau de neurones. Les filets convolutifs ont étonné le monde avec leur capacité à généraliser bien mieux que d'autres techniques. Mais si le réseau est uniquement alimenté d'images de chats, il ne reconnaîtra que les chats (et verra probablement des chats partout, comme par les résultats du réseau contradictoire). En d'autres termes, même les CN ont du mal à généraliser trop loin au - delà de ce qu'ils ont appris.

La limite de reconnaissance est difficile à définir avec précision. Je dirais simplement que la diversité des données d'apprentissage repousse les limites (je suppose que des détails supplémentaires devraient conduire à un lieu de discussion plus approprié).

Eric Platon
la source
5

La réponse simple est "non, ils ne se limitent pas aux images": les CNN sont également utilisés pour le traitement du langage naturel. (Voir ici pour une introduction.)

Je ne les ai pas encore vus appliqués aux données graphiques, mais je n'ai pas regardé; il y a des choses évidentes à essayer et je suis donc optimiste que cela fonctionnerait.

Matthew Graves
la source
3

Le réseau de neurones convolutifs peut être appliqué non seulement pour la reconnaissance d'images mais aussi pour l'analyse et la reconnaissance vidéo, le traitement du langage naturel, dans les jeux (par exemple Go ) ou même pour la découverte de médicaments en prédisant l'interaction entre les molécules et les protéines biologiques wiki .

Par conséquent, il peut être utilisé pour divers problèmes en utilisant des couches convolutives et de sous-échantillonnage connectées à des couches plus pleinement connectées. Ils sont plus faciles à former, car ils ont moins de paramètres que les réseaux entièrement connectés avec le même nombre d'unités cachées. UFLDL

kenorb
la source
3

A convolutional neural network can be used wherever patterns are locally correlated and translatable (as in shiftable). This is the case because CNNs contain filters that look for certain local patterns everywhere in the input. You'll find local and translatable patterns in pictures, text, time series, etc.

Il n'est pas aussi logique d'utiliser des CNN si vos données ressemblent plus à un sac de fonctionnalités avec un ordre non pertinent. Dans ce cas, vous pourriez avoir du mal à détecter les modèles qui contiennent des entités qui se trouvent être plus éloignées les unes des autres dans votre vecteur d'entrée. Vous ne trouverez pas de modèles locaux et traduisibles dans vos données si vous pouvez réorganiser les points de données des vecteurs d'entrée sans perdre d'informations.

BlindKungFuMaster
la source