Questions marquées «dropout»

65

Où devrais-je placer des couches de décrochage dans un réseau de neurones?

Existe-t-il des directives générales sur l'emplacement des couches d'abandon dans un réseau de

neural-networks dropout

35

Les couches de regroupement sont-elles ajoutées avant ou après les couches de suppression?

Je crée un réseau de neurones à convolution (CNN) dans lequel j'ai une couche de convolution suivie par une couche de mise en commun et je souhaite appliquer la suppression pour réduire le surajustement. J'ai le sentiment que la couche de suppression devrait être appliquée après la couche de mise...

deep-learning conv-neural-network dropout

24

Quelle est la différence entre abandon et drop connect?

Quelle est la différence entre abandon et drop connect? AFAIK, le décrochage supprime aléatoirement les nœuds cachés pendant la formation, mais les maintient dans les tests, et le drop connect supprime les connexions. Mais la suppression des connexions n'est-elle pas équivalente à la suppression...

neural-networks dropout

21

Stimuler les réseaux de neurones

Eh bien récemment, je travaillais sur l'apprentissage d'algorithmes de renforcement, tels que adaboost, gradient boost, et je savais que le plus faible apprenant utilisé était les arbres. Je veux vraiment savoir s'il existe des exemples récents de succès (je veux dire des articles ou des articles)...

neural-networks deep-learning boosting ensemble dropout

17

Comment expliquer la régularisation du décrochage en termes simples?

Si vous avez une demi-page pour expliquer l' abandon , comment procéderiez-vous? Quelle est la raison d'être de cette

neural-networks deep-learning regularization dropout

14

Comment le décrochage spatial en 2D est-il implémenté?

Ceci est en référence à l'article Localisation efficace des objets utilisant des réseaux convolutionnels , et d'après ce que je comprends, le décrochage est implémenté en 2D. Après avoir lu le code de Keras sur la façon dont le décrochage 2D spatial est implémenté, un masque binaire aléatoire de...

machine-learning deep-learning tensorflow dropout

10

Abandon: mise à l'échelle de l'activation par rapport à l'inversion de l'abandon

Lors de l'application du décrochage dans les réseaux de neurones artificiels, il faut compenser le fait qu'au moment de l'entraînement, une partie des neurones était désactivée. Pour ce faire, il existe deux stratégies communes: mise à l'échelle de l'activation au moment du test inverser le...

neural-networks deep-learning dropout

9

Les arrêts et abandons précoces sont-ils suffisants pour régulariser la grande majorité des réseaux de neurones profonds dans la pratique?

Il y a tellement de techniques de régularisation qu'il n'est pas pratique d'essayer toutes les combinaisons: l1 / l2 norme max abandonner arrêt précoce ... Il semble que la plupart des gens soient satisfaits d'une combinaison d'abandon + d'arrêt précoce: y a-t-il des cas où l'utilisation d'autres...

neural-networks regularization dropout

8

Alternatives à la généralisation L1, L2 et Dropout

J'ai la configuration suivante pour un projet de recherche Finance / Machine Learning dans mon université: j'applique un (Deep) Neural Network (MLP) avec la structure suivante dans Keras / Theano pour distinguer les actions surperformantes (étiquette 1) des actions sous-performantes ( étiquette 0)....

machine-learning neural-networks deep-learning regularization dropout