Questions marquées «deep-learning»

13

Pourquoi l'apprentissage par renforcement profond est-il instable?

Dans l'article de DeepMind de 2015 sur l'apprentissage par renforcement profond, il déclare que «les tentatives précédentes de combiner RL avec des réseaux de neurones ont échoué en grande partie en raison d'un apprentissage instable». L'article énumère ensuite certaines causes de cela, en fonction...

13

Comment former la couche LSTM de réseau profond

J'utilise un réseau lstm et feed-forward pour classer le texte. Je convertis le texte en vecteurs uniques et les insère dans le lstm afin de pouvoir le résumer en une seule représentation. Ensuite, je le nourris à l'autre réseau. Mais comment former le lstm? Je veux juste classer le texte en...

classification neural-networks deep-learning lstm

13

Comment les réseaux de neurones convolutionnels utilisent-ils exactement la convolution à la place de la multiplication matricielle?

Je lisais le livre de Yoshua Bengio sur l'apprentissage profond et il est dit à la page 224: Les réseaux convolutifs sont simplement des réseaux neuronaux qui utilisent la convolution à la place de la multiplication matricielle générale dans au moins une de leurs couches. cependant, je ne savais...

machine-learning neural-networks deep-learning convolution

13

Le réseau neuronal (par exemple, le réseau neuronal convolutionnel) peut-il avoir des poids négatifs?

Est-il possible d'avoir des poids négatifs (après suffisamment d'époques) pour les réseaux neuronaux convolutionnels profonds lorsque nous utilisons ReLU pour toutes les couches

machine-learning neural-networks deep-learning conv-neural-network

13

Pourquoi l'algorithme de descente «Saddle-Free Newton» n'est-il pas utilisé en pratique?

Récemment, j'ai lu un article de Yann Dauphin et al. Identifier et attaquer le problème du point de selle dans l'optimisation non convexe de haute dimension , où ils introduisent un algorithme de descente intéressant appelé Saddle-Free Newton , qui semble être exactement adapté pour l'optimisation...

optimization deep-learning gradient-descent

13

Empêcher le surajustement de LSTM sur un petit ensemble de données

Je modélise 15000 tweets pour la prédiction des sentiments en utilisant un LSTM monocouche avec 128 unités cachées en utilisant une représentation de type word2vec avec 80 dimensions. J'obtiens une précision de descente (38% avec aléatoire = 20%) après 1 époque. Plus l'entraînement fait baisser la...

deep-learning regularization overfitting lstm

13

Existe-t-il un outil visuel pour concevoir et appliquer des réseaux neuronaux / apprentissage en profondeur? [fermé]

Fermé. Cette question est hors sujet . Il n'accepte pas actuellement les réponses. Vous souhaitez améliorer cette question? Mettez à jour la question afin qu'elle soit sur le sujet pour la validation croisée. Fermé il y a 10 mois . Je sais qu'il y a beaucoup de bibliothèques pour l'apprentissage...

neural-networks deep-learning conv-neural-network

13

Quelles sont les techniques utiles d'augmentation des données pour les réseaux de neurones convolutionnels profonds?

Contexte: J'ai récemment compris à un niveau plus profond l'importance de l'augmentation des données lors de la formation des réseaux de neurones convolutionnels après avoir vu cet excellent discours de Geoffrey Hinton . Il explique que les réseaux de neurones convolutifs de génération actuelle ne...

machine-learning deep-learning

13

Modèle Google Inception: pourquoi il y a plusieurs softmax?

La topologie du modèle Google Inception est disponible ici: Google Inception Netowrk J'ai remarqué qu'il y a 3 couches softmax dans ce modèle (# 154, # 152, # 145), et 2 d'entre elles sont une sorte d'évasion précoce de ce modèle. D'après ce que je sais, la couche softmax est pour la sortie finale,...

deep-learning conv-neural-network

13

Que signifie «de bout en bout» dans les méthodes d'apprentissage en profondeur?

Je veux savoir ce que c'est et comment est-ce différent de l'assemblage? Supposons que je souhaite atteindre une grande précision dans la classification et la segmentation, pour une tâche spécifique, si j'utilise différents réseaux, tels que CNN, RNN, etc. pour y parvenir, est-ce que cela s'appelle...

machine-learning terminology deep-learning

13

L'apprentissage en profondeur est-il utile pour l'optimisation combinatoire?

Existe-t-il des groupes de recherche travaillant sur l'utilisation du deep learning pour les problèmes d'optimisation combinatoire?

optimization deep-learning

13

Qu'est-ce que le Deep Bayesian Learning?

Qu'est-ce que le Deep Learning Bayésien et comment est-il lié aux statistiques bayésiennes traditionnelles et au Deep Learning traditionnel? Quels sont les principaux concepts et mathématiques impliqués? Puis-je dire que ce sont juste des statistiques bayésiennes non paramétriques? Quels sont ses...

bayesian deep-learning

13

Pourquoi les réseaux de neurones sont-ils facilement trompés?

J'ai lu des articles sur la création manuelle d'images pour "tromper" un réseau de neurones (voir ci-dessous). Est-ce parce que les réseaux ne modélisent que la probabilité conditionnelle ? Si un réseau peut modéliser la probabilité conjointe p ( y , x ) , de tels cas se produiront-ils toujours?p (...

machine-learning neural-networks deep-learning

12

Choisir la taille du filtre, les foulées, etc. dans un CNN?

J'ai regardé les conférences CS231N de Stanford et j'essaie de comprendre quelques problèmes dans les architectures CNN. Ce que j'essaie de comprendre, c'est s'il existe des directives générales pour choisir la taille du filtre de convolution et des choses comme les enjambées ou est-ce plus un art...

neural-networks deep-learning conv-neural-network

12

Non-linéarité avant la couche Softmax finale dans un réseau neuronal convolutionnel

J'étudie et j'essaie de mettre en œuvre des réseaux de neurones convolutionnels, mais je suppose que cette question s'applique aux perceptrons multicouches en général. Les neurones de sortie de mon réseau représentent l'activation de chaque classe: le neurone le plus actif correspond à la classe...

neural-networks deep-learning conv-neural-network nonlinear softmax

12

Forme matricielle de rétropropagation avec normalisation par lots

La normalisation des lots a été attribuée à des améliorations substantielles des performances dans les réseaux neuronaux profonds. De nombreux documents sur Internet montrent comment l'implémenter sur une base d'activation par activation. J'ai déjà implémenté backprop en utilisant l'algèbre...

machine-learning neural-networks deep-learning backpropagation batch-normalization

12

Motivation des unités de sortie sigmoïdes dans les réseaux de neurones commençant par des probabilités logarithmiques non normalisées linéaires en

Contexte: J'étudie le chapitre 6 du Deep Learning par Ian Goodfellow et Yoshua Bengio et Aaron Courville. Dans la section 6.2.2.2 (pages 182 de 183 qui peuvent être consultées ici ), l'utilisation de sigmoïde pour produire est motivée.P(y=1|x)P(y=1|x)P(y=1|x) Pour résumer une partie du matériel,...

neural-networks deep-learning

12

Architectures neuronales: conception automatique basée sur les données

Les progrès récents dans les réseaux de neurones sont résumés par une séquence de nouvelles architectures caractérisées principalement par sa complexité croissante de conception. De LeNet5 (1994) à AlexNet (2012), à Overfeat (2013) et GoogleLeNet / Inception (2014) et ainsi de suite ... Y a-t-il...

neural-networks deep-learning

12

Qu'est-ce qu'un bloc d'apprentissage résiduel dans le contexte des réseaux résiduels profonds dans l'apprentissage profond?

Je lisais le document Deep Residual Learning for Image Recognition et j'avais du mal à comprendre avec 100% de certitude ce qu'implique un bloc résiduel sur le plan informatique. En lisant leur article, ils ont la figure 2: qui illustre ce qu'est un bloc résiduel. Le calcul d'un bloc résiduel...

machine-learning neural-networks deep-learning conv-neural-network residual-networks

12

Quelle est la différence entre la régression linéaire «régulière» et la régression linéaire d'apprentissage profond?

Je veux connaître la différence entre la régression linéaire dans une analyse d'apprentissage automatique régulière et la régression linéaire dans le cadre d'un "apprentissage profond". Quels algorithmes sont utilisés pour la régression linéaire dans le cadre de l'apprentissage en...

regression machine-learning deep-learning