J'écoutais un discours et j'ai vu cette diapositive:
Est-ce vrai?
deep-learning
deep-belief-networks
Franck Dernoncourt
la source
la source
Réponses:
Je parcourais AI StackExchange et suis tombé sur une question très similaire: qu'est - ce qui distingue le «Deep Learning» des autres réseaux de neurones?
Comme AI StackExchange fermera demain (à nouveau), je vais copier les deux premières réponses ici (contributions des utilisateurs sous licence cc by-sa 3.0 avec attribution requise):
Auteur: mommi84less
Auteur: lejlot
Une autre diapositive intéressante:
la source
la source
Le décrochage, de Hinton en 2006, serait la plus grande amélioration de l'apprentissage en profondeur des 10 dernières années, car il réduit beaucoup le surapprentissage.
la source
C'est certainement une question qui suscitera la controverse.
Lorsque les réseaux de neurones sont utilisés dans l'apprentissage en profondeur, ils sont généralement formés d'une manière qui n'était pas utilisée dans les années 1980. En particulier, des stratégies qui préentraînent des couches individuelles du réseau neuronal pour reconnaître des caractéristiques à différents niveaux sont censées faciliter la formation de réseaux à plusieurs couches. C'est certainement un nouveau développement depuis les années 1980.
la source
La clé est le mot «profond» dans l'apprentissage en profondeur. Quelqu'un (oubli ref) dans les années 80 a prouvé que toutes les fonctions non linéaires pouvaient être approximées par un réseau neuronal à une seule couche avec, bien sûr, un nombre suffisamment grand d'unités cachées. Je pense que ce résultat a probablement découragé les gens de chercher un réseau plus profond à l'époque antérieure.
Mais la profondeur du réseau est ce qui s'est avéré être l'élément crucial de la représentation hiérarchique qui est à l'origine du succès de nombreuses applications d'aujourd'hui.
la source
Pas exactement, l'ANN commence dans les années 50. Découvrez l'une des diapositives de la star du rock ML Yann LeCun pour une intro authentique et complète. http://www.cs.nyu.edu/~yann/talks/lecun-ranzato-icml2013.pdf
la source