Questions marquées «networks»

9

Quelle est l'efficacité de Q-learning avec les réseaux de neurones quand il y a une unité de sortie par action?

Contexte: J'utilise l'approximation de la valeur Q du réseau neuronal dans ma tâche d'apprentissage par renforcement. L'approche est exactement la même que celle décrite dans cette question , mais la question elle-même est différente. Dans cette approche, le nombre de sorties est le nombre...

9

Les arrêts et abandons précoces sont-ils suffisants pour régulariser la grande majorité des réseaux de neurones profonds dans la pratique?

Il y a tellement de techniques de régularisation qu'il n'est pas pratique d'essayer toutes les combinaisons: l1 / l2 norme max abandonner arrêt précoce ... Il semble que la plupart des gens soient satisfaits d'une combinaison d'abandon + d'arrêt précoce: y a-t-il des cas où l'utilisation d'autres...

neural-networks regularization dropout

9

Comment le générateur d'un GAN est-il formé?

Le document sur les GAN indique que le discriminateur utilise le gradient suivant pour s'entraîner: ∇θré1m∑i = 1m[ journalD (X( i )) +journal( 1 - D ( G (z( i )) ) ) ]∇θd1m∑i=1m[log⁡D(x(i))+log⁡(1−D(G(z(i))))]\nabla _{\theta_d} \frac{1}{m}\sum^{m}_{i=1} [\log{D(x^{(i)})} + \log{(1-D(G(z^{(i)})))}]...

machine-learning neural-networks

9

Comment appliquer Softmax comme fonction d'activation dans Perceptron multicouche dans Scikit-Learn? [fermé]

Fermé. Cette question est hors sujet . Il n'accepte pas actuellement les réponses. Vous souhaitez améliorer cette question? Mettez à jour la question afin qu'elle soit sur le sujet pour la validation croisée. Fermé il y a 11 mois . Je dois appliquer la fonction d'activation Softmax au Perceptron...

neural-networks scikit-learn multi-class softmax

9

Sélection des fonctionnalités à l'aide de l'apprentissage en profondeur?

Je veux calculer l'importance de chaque fonction d'entrée en utilisant un modèle profond. Mais je n'ai trouvé qu'un seul article sur la sélection des fonctionnalités à l'aide de l'apprentissage en profondeur - la sélection des fonctionnalités approfondies . Ils insèrent une couche de nœuds...

feature-selection deep-learning deep-belief-networks rbm

9

Dégradés pour skipgram word2vec

Je passe en revue les problèmes liés aux problèmes d'affectation écrits de la classe d'apprentissage profond de Stanford NLP http://cs224d.stanford.edu/assignment1/assignment1_soln J'essaie de comprendre la réponse pour 3a où ils recherchent la dérivée du vecteur pour le mot central. Supposons que...

self-study neural-networks backpropagation word2vec

9

Comprendre la topologie LSTM

Comme beaucoup d'autres, j'ai trouvé les ressources ici et ici extrêmement utiles pour comprendre les cellules LSTM. Je suis convaincu que je comprends comment les valeurs circulent et sont mises à jour, et je suis assez confiant pour ajouter les "connexions judas" mentionnées, etc. également. Dans...

machine-learning neural-networks lstm rnn

9

Les données d'entraînement sont déséquilibrées - mais mon ensemble de validation devrait-il l'être également?

J'ai étiqueté des données composées de 10000 exemples positifs et 50000 exemples négatifs, ce qui donne un total de 60000 exemples. Évidemment, ces données sont déséquilibrées. Disons maintenant que je veux créer mon ensemble de validation et que je souhaite utiliser 10% de mes données pour le...

machine-learning neural-networks cross-validation dataset unbalanced-classes

9

La formation d'un réseau de neurones pour la régression prédit toujours la moyenne

Je forme un réseau neuronal convolutionnel simple pour la régression, où la tâche consiste à prédire l'emplacement (x, y) d'une boîte dans une image, par exemple: La sortie du réseau a deux nœuds, un pour x et un pour y. Le reste du réseau est un réseau neuronal convolutif standard. La perte est...

machine-learning neural-networks optimization deep-learning loss-functions

9

Comment interpréter une courbe de survie du modèle de risque de Cox?

Comment interprétez-vous une courbe de survie à partir du modèle de risque proportionnel cox? Dans cet exemple de jouet, supposons que nous ayons un modèle de risque proportionnel cox sur agevariable dans les kidneydonnées et générons la courbe de survie. library(survival) fit <-...

r survival cox-model likelihood machine-learning deep-learning generative-models machine-learning reinforcement-learning q-learning regression multicollinearity convergence beta-distribution bernoulli-distribution machine-learning self-study pattern-recognition neural-networks stochastic-processes linear

9

Quel modèle d'apprentissage en profondeur peut classer des catégories qui ne s'excluent pas mutuellement

Exemples: J'ai une phrase dans la description de poste: "Java senior engineer in UK". Je veux utiliser un modèle d'apprentissage profond pour le prédire en 2 catégories: English et IT jobs. Si j'utilise un modèle de classification traditionnel, il ne peut prédire qu'une seule étiquette avec...

machine-learning deep-learning natural-language tensorflow sampling distance non-independent application regression machine-learning logistic mixed-model control-group crossover r multivariate-analysis ecology procrustes-analysis vegan regression hypothesis-testing interpretation chi-squared bootstrap r bioinformatics bayesian exponential beta-distribution bernoulli-distribution conjugate-prior distributions bayesian prior beta-distribution covariance naive-bayes smoothing laplace-smoothing distributions data-visualization regression probit penalized estimation unbiased-estimator fisher-information unbalanced-classes bayesian model-selection aic multiple-regression cross-validation regression-coefficients nonlinear-regression standardization naive-bayes trend machine-learning clustering unsupervised-learning wilcoxon-mann-whitney z-score econometrics generalized-moments method-of-moments machine-learning conv-neural-network image-processing ocr machine-learning neural-networks conv-neural-network tensorflow r logistic scoring-rules probability self-study pdf cdf classification svm resampling forecasting rms volatility-forecasting diebold-mariano neural-networks prediction-interval uncertainty

9

Différenciation d'entropie croisée

J'ai essayé de créer un programme pour former des réseaux neuronaux sur mon ordinateur. Pour le réseau en question, j'ai décidé d'utiliser la fonction Cross Entropy Error: E= -∑jtjlnojE=−∑jtjln⁡ojE = -\sum_jt_j\ln o_j Où est la sortie cible pour le neurone , et est la sortie de ce neurone, essayant...

machine-learning neural-networks derivative cross-entropy differential-equations

9

Qu'est-ce que la prédiction dense dans le Deep Learning?

J'utilise le modèle pré-formé de TensorFlow de réseau neuronal convolutionnel. https://github.com/tensorflow/models/blob/master/slim/nets/resnet_v2.py#L130 J'ai trouvé la phrase suivante: Cependant, pour les tâches de prédiction denses, nous conseillons d'utiliser des entrées dont les dimensions...

neural-networks conv-neural-network

9

Consigner les probabilités en référence au classificateur softmax

Dans ce https://cs231n.github.io/neural-networks-case-study/ pourquoi mentionne-t-il "le classificateur Softmax interprète chaque élément de ff comme détenant les probabilités de log (non normalisées) des trois classes." Je comprends pourquoi il n'est pas normalisé mais pas pourquoi il s'agit d'un...

machine-learning neural-networks information-theory softmax

9

Où trouver des modèles pré-formés pour l'apprentissage par transfert [fermé]

Fermé . Cette question doit être plus ciblée . Il n'accepte pas actuellement les réponses. Vous souhaitez améliorer cette question? Mettez à jour la question pour qu'elle se concentre sur un seul problème en modifiant ce post . Fermé il y a 2 ans . Je suis nouveau dans le domaine de...

machine-learning classification neural-networks transfer-learning

9

Combien de paramètres y a-t-il dans une couche de réseau neuronal récurrent (RNN)?

Le titre dit tout - combien de paramètres entraînables y a-t-il dans une couche GRU? Ce type de question revient souvent lorsque l'on tente de comparer des modèles de différents types de couches RNN, tels que les unités de mémoire à court terme (LSTM) vs GRU, en termes de performances par...

neural-networks rnn gru

9

Autoencodeur variationnel avec modèle de mélange gaussien

Un autoencodeur variationnel (VAE) fournit un moyen d'apprendre la distribution de probabilité reliant une entrée à sa représentation latente . En particulier, le codeur e mappe une entrée x à une distribution sur z . Un encodeur typique affichera des paramètres (\ mu, \ sigma) = e (x) ,...

neural-networks deep-learning autoencoders variational-bayes

9

Mon réseau de neurones ne peut même pas apprendre la distance euclidienne

J'essaie donc de m'enseigner les réseaux de neurones (pour les applications de régression, pas pour classer les photos de chats). Mes premières expériences ont été la formation d'un réseau pour implémenter un filtre FIR et une transformée de Fourier discrète (formation sur les signaux "avant" et...

machine-learning neural-networks optimization keras euclidean

9

La fonction

Une fonction sous la forme a-t-elle un nom standard? Par exemple, est une fonction linéaire.eX/ (1+ eX)eX/(1+eX)e^x/(1+e^x)y= a + b xy=une+bXy = a +

logistic neural-networks deep-learning terminology

9

Pourquoi des informations sur les données de validation ont-elles été divulguées si j'évalue les performances du modèle sur les données de validation lors du réglage des hyperparamètres?

Dans le Deep Learning de François Chollet avec Python, il est écrit: Par conséquent, le réglage de la configuration du modèle en fonction de ses performances sur l'ensemble de validation peut rapidement entraîner un surajustement de l'ensemble de validation, même si votre modèle n'est jamais...

neural-networks cross-validation hyperparameter