Keras prend en charge TensorFlow et Theano en tant que backend: quels sont les avantages / inconvénients de choisir l'un par rapport à l'autre, outre le fait que toutes les opérations ne sont actuellement pas implémentées avec le backend
Keras prend en charge TensorFlow et Theano en tant que backend: quels sont les avantages / inconvénients de choisir l'un par rapport à l'autre, outre le fait que toutes les opérations ne sont actuellement pas implémentées avec le backend
Quel est le meilleur pour la précision ou sont-ils les mêmes? Bien sûr, si vous utilisez categorical_crossentropy vous utilisez un encodage à chaud, et si vous utilisez sparse_categorical_crossentropy vous encodez comme des entiers normaux. De plus, quand est-ce que l'un est meilleur que...
Les fonctions d'activation sont utilisées pour introduire des non-linéarités dans la sortie linéaire du type w * x + bdans un réseau neuronal. Ce que je peux comprendre intuitivement pour les fonctions d'activation comme sigmoïde. Je comprends les avantages de ReLU, qui évite les neurones morts...
Je me demandais comment devons-nous décider du nombre de nœuds dans les couches cachées et du nombre de couches cachées à mettre lorsque nous construisons une architecture de réseau neuronal. Je comprends que la couche d'entrée et de sortie dépend de l'ensemble de formation que nous avons, mais...
Du code Tensorflow : Tensorflow. RnnCell. num_units: int, The number of units in the LSTM cell. Je ne peux pas comprendre ce que cela signifie. Quelles sont les unités de la cellule LSTM. Entrée, sortie et oublier les portes? Cela signifie-t-il «nombre d'unités dans la couche de projection...
J'utilise des réseaux de neurones depuis un certain temps maintenant. Cependant, une chose avec laquelle je me bats constamment est la sélection d'un optimiseur pour la formation du réseau (en utilisant backprop). Ce que je fais habituellement, c'est de commencer par un seul (par exemple SGD...
De Keras RNN Tutorial: "Les RNN sont difficiles. Le choix de la taille des lots est important, le choix de la perte et de l'optimiseur est critique, etc. Certaines configurations ne convergent pas." Il s'agit donc plus d'une question générale sur le réglage des hyperparamètres d'un LSTM-RNN sur...
J'essaie de comprendre le rôle de la dérivée de la fonction sigmoïde dans les réseaux de neurones. Je trace d'abord la fonction sigmoïde et la dérivée de tous les points de la définition à l'aide de python. Quel est exactement le rôle de ce dérivé? import numpy as np import matplotlib.pyplot as plt...
J'ai du mal à dériver la propagation avec ReLU, et j'ai fait du travail, mais je ne sais pas si je suis sur la bonne voie. Fonction de coût: où est la valeur réelle et est une valeur prédite. Supposons également que > 0 toujours.y y x12(y−y^)212(y-y^)2\frac{1}{2}(y-\hat y)^2yyyy^y^\hat yxXx 1...
Je travaille sur une question du livre en ligne: http://neuralnetworksanddeeplearning.com/chap1.html Je peux comprendre que si la couche de sortie supplémentaire est composée de 5 neurones de sortie, je pourrais probablement définir un biais à 0,5 et un poids de 0,5 pour la couche précédente. Mais...
J'ai un ensemble de données avec 3 classes avec les éléments suivants: Classe 1: 900 éléments Classe 2: 15 000 éléments Classe 3: 800 éléments Je dois prédire les classes 1 et 3, qui signalent des écarts importants par rapport à la norme. La classe 2 est le cas «normal» par défaut dont je me fiche....
Je fais un projet sur le problème d'identification des auteurs. J'avais appliqué la normalisation tf-idf pour former des données, puis formé un svm sur ces données. Maintenant, lorsque j'utilise le classificateur, dois-je également normaliser les données de test. Je pense que l'objectif de base de...
Considérons un réseau de neurones: Pour un ensemble de données donné, nous le divisons en ensemble de formation, de validation et de test. Supposons que nous le fassions dans le rapport classique 60:20:20, puis nous empêchons le surapprentissage en validant le réseau en le vérifiant sur l'ensemble...
L'ensachage est la génération de plusieurs prédicteurs qui fonctionnent comme un prédicteur unique. Le décrochage est une technique qui enseigne à un réseau de neurones à faire la moyenne de tous les sous-réseaux possibles. En regardant les compétitions les plus importantes de Kaggle, il semble que...
Ici, la réponse se réfère à des gradients de fuite et d'explosion qui ont été sigmoiddes fonctions d'activation similaires, mais, je suppose, Reluont un inconvénient et c'est sa valeur attendue. il n'y a pas de limitation pour la sortie du Reluet donc sa valeur attendue n'est pas nulle. Je me...
Je crée un corr()df à partir d'un df d'origine. Le corr()df est sorti 70 X 70 et il est impossible de visualiser le heatmap ... sns.heatmap(df). Si j'essaie d'afficher le corr = df.corr(), le tableau ne correspond pas à l'écran et je peux voir toutes les corrélations. Est-ce un moyen d'imprimer...
Je sais qu'il n'y a pas de réponse claire à cette question, mais supposons que j'ai un énorme réseau de neurones, avec beaucoup de données et je veux ajouter une nouvelle fonctionnalité en entrée. La "meilleure" façon serait de tester le réseau avec la nouvelle fonctionnalité et de voir les...
Supposons que nous ayons deux types de fonctions d'entrée, catégoriques et continues. Les données catégorielles peuvent être représentées sous la forme d'un code unique A, tandis que les données continues ne sont qu'un vecteur B dans un espace à N dimensions. Il semble que le simple fait d'utiliser...
Je joue un peu avec des convnets. Plus précisément, j'utilise l'ensemble de données kaggle cats-vs-dogs qui consiste en 25000 images étiquetées comme chat ou chien (12500 chacune). J'ai réussi à atteindre une précision de classification d'environ 85% sur mon test, mais je me suis fixé comme...
En lisant sur la génération de texte avec les réseaux de neurones récurrents, j'ai remarqué que certains exemples ont été mis en œuvre pour générer du texte mot par mot et d'autres caractère par caractère sans vraiment expliquer pourquoi. Alors, quelle est la différence entre les modèles RNN qui...