Keras prend en charge TensorFlow et Theano en tant que backend: quels sont les avantages / inconvénients de choisir l'un par rapport à l'autre, outre le fait que toutes les opérations ne sont actuellement pas implémentées avec le backend
Keras prend en charge TensorFlow et Theano en tant que backend: quels sont les avantages / inconvénients de choisir l'un par rapport à l'autre, outre le fait que toutes les opérations ne sont actuellement pas implémentées avec le backend
Les fonctions d'activation sont utilisées pour introduire des non-linéarités dans la sortie linéaire du type w * x + bdans un réseau neuronal. Ce que je peux comprendre intuitivement pour les fonctions d'activation comme sigmoïde. Je comprends les avantages de ReLU, qui évite les neurones morts...
De Keras RNN Tutorial: "Les RNN sont difficiles. Le choix de la taille des lots est important, le choix de la perte et de l'optimiseur est critique, etc. Certaines configurations ne convergent pas." Il s'agit donc plus d'une question générale sur le réglage des hyperparamètres d'un LSTM-RNN sur...
J'ai entendu Andrew Ng (dans une vidéo que je ne trouve malheureusement plus) parler de la façon dont la compréhension des minima locaux dans les problèmes d'apprentissage profond a changé en ce sens qu'ils sont maintenant considérés comme moins problématiques car dans les espaces de grande...
Quelle est la différence entre val_losset losspendant la formation à Keras? Par exemple Epoch 1/20 1000/1000 [==============================] - 1s - loss: 0.1760, val_loss: 0.2032 Sur certains sites, j'ai lu qu'à la validation, le décrochage ne fonctionnait
Je fais un projet sur le problème d'identification des auteurs. J'avais appliqué la normalisation tf-idf pour former des données, puis formé un svm sur ces données. Maintenant, lorsque j'utilise le classificateur, dois-je également normaliser les données de test. Je pense que l'objectif de base de...
J'essaie de calculer la quantité de mémoire nécessaire à un GPU pour entraîner mon modèle sur la base de ces notes d'Andrej Karphaty: http://cs231n.github.io/convolutional-networks/#computational-considerations Mon réseau a 532 752 activations et 19 072 984 paramètres (poids et biais). Ce sont...
Ici, la réponse se réfère à des gradients de fuite et d'explosion qui ont été sigmoiddes fonctions d'activation similaires, mais, je suppose, Reluont un inconvénient et c'est sa valeur attendue. il n'y a pas de limitation pour la sortie du Reluet donc sa valeur attendue n'est pas nulle. Je me...
L'ensachage est la génération de plusieurs prédicteurs qui fonctionnent comme un prédicteur unique. Le décrochage est une technique qui enseigne à un réseau de neurones à faire la moyenne de tous les sous-réseaux possibles. En regardant les compétitions les plus importantes de Kaggle, il semble que...
Je crée un corr()df à partir d'un df d'origine. Le corr()df est sorti 70 X 70 et il est impossible de visualiser le heatmap ... sns.heatmap(df). Si j'essaie d'afficher le corr = df.corr(), le tableau ne correspond pas à l'écran et je peux voir toutes les corrélations. Est-ce un moyen d'imprimer...
Je joue un peu avec des convnets. Plus précisément, j'utilise l'ensemble de données kaggle cats-vs-dogs qui consiste en 25000 images étiquetées comme chat ou chien (12500 chacune). J'ai réussi à atteindre une précision de classification d'environ 85% sur mon test, mais je me suis fixé comme...
Quelle est la différence entre fit()et fit_generator()à Keras? Quand dois-je utiliser fit()vs
Dans le blog Keras sur la formation des convnets à partir de zéro , le code affiche uniquement le réseau fonctionnant sur les données de formation et de validation. Qu'en est-il des données de test? Les données de validation sont-elles les mêmes que les données de test (je pense que non). S'il y...
Je commence à apprendre l'apprentissage automatique sur le site Web de Tensorflow. J'ai développé une compréhension très très rudimentaire du déroulement d'un programme d'apprentissage en profondeur (cette méthode me permet d'apprendre rapidement au lieu de lire des livres et de gros articles). Il...
Disons que j'ai une image descendante d'une flèche et que je veux prédire l'angle de cette flèche. Ce serait entre et degrés, ou entre et . Le problème est que cette cible est circulaire, et degrés sont exactement les mêmes, ce qui est une invariance que j'aimerais incorporer dans ma cible, ce qui...
Supposons que j'ai effectué un transfert d'apprentissage sur un réseau pré-formé pour reconnaître 10 objets. Comment ajouter un 11ème élément que le réseau peut classer sans perdre les 10 catégories que j'ai déjà formées ni les informations du modèle pré-formé d'origine? Un ami m'a dit que des...
Comment utilisez-vous LeakyRelu comme fonction d'activation dans la séquence DNN en keras? Si je veux écrire quelque chose de similaire à: model = Sequential() model.add(Dense(90, activation='LeakyRelu')) Quelle est la solution? Mettez LeakyRelu similaire à Relu? La deuxième question est: quel est...
Google a récemment inclus dans tensorflow's nightly builds son Eager mode, une API impérative pour accéder aux capacités de calcul tensorflow. Comment tensorflow désireux se compare-t-il à PyTorch? Certains aspects qui pourraient affecter la comparaison pourraient être: Avantages et inconvénients...
Je me demande dans quelles situations il est avantageux d'empiler des
Je fais face à un problème où je n'ai pas pu trouver suffisamment de jeux de données (images) pour alimenter mon réseau neuronal profond pour l'entraînement. J'ai été tellement inspiré par l'article Generative Adversarial Text to Image Synthesis publié par Scott Reed et al. sur les réseaux...