Quels algorithmes d'apprentissage automatique (outre les SVM) utilisent le principe de minimisation des risques structurels
Quels algorithmes d'apprentissage automatique (outre les SVM) utilisent le principe de minimisation des risques structurels
J'ai une requête complexe utilisée pour rechercher un ensemble de données pour trouver . Chaque requête prend un temps moyen donc le temps global dans la recherche linéaire est. Je peux décomposer une requête en sous-requêtes plus simples q_i et trouver H_ \ text {approx} = \ {s \ in S \ mid \...
Supposons que vous étendez le calcul des constructions avec des "trous" - c'est-à-dire des morceaux de code incomplets que vous n'avez pas encore remplis. Je me demande s'il existe un algorithme pour remplir ces rôles automatiquement. Par exemple (en utilisant la syntaxe de Morte ): Cas A: λ (pred...
J'ai découvert les réseaux neuronaux et les SVM. Les tutoriels que j'ai lus ont souligné l'importance de la noyauisation pour les SVM. Sans fonction de noyau, les SVM ne sont qu'un classificateur linéaire. Avec la noyauisation, les SVM peuvent également incorporer des fonctionnalités non linéaires,...
Avertissement: je suis un biologiste, donc désolé pour (peut-être) une question de base formulée en termes aussi grossiers. Je ne sais pas si je devrais poser cette question ici ou sur DS / SC, mais CS est le plus grand des trois, alors voilà. (Après avoir posté, il m'est venu à l'esprit que la...
J'ai implémenté un réseau neuronal (utilisant CUDA) avec 2 couches. (2 neurones par couche). J'essaie de lui faire apprendre 2 fonctions polynomiales quadratiques simples en utilisant la rétropropagation . Mais au lieu de converger, il diverge (la sortie devient l'infini) Voici quelques détails...
Sur la page wikipedia ici, il décrit assez bien l'algorithme CDCL (et il semble que les photos ont été prises à partir de diapositives créées par Sharad Malik à Princeton). Cependant, quand il décrit comment revenir en arrière, tout ce qu'il dit est "au point approprié". MiniSAT utilise également...
Pourquoi les poids initiaux des réseaux de neurones sont-ils initialisés sous forme de nombres aléatoires? J'avais lu quelque part que cela est fait pour "briser la symétrie" et que le réseau neuronal apprend plus vite. Comment briser la symétrie permet-elle d'apprendre plus rapidement? Est-ce que...
Lors de la mise à jour des poids d'un réseau neuronal en utilisant l'algorithme de rétropropagation avec un terme de momentum, le taux d'apprentissage devrait-il également être appliqué au terme de momentum? La plupart des informations que j'ai pu trouver sur l'utilisation de l'élan ont les...
J'ai récemment discuté avec un ami d'un site Web qui proposait des défis d'expression régulière, correspondant principalement à un groupe de mots avec une propriété spéciale. Il cherchait une expression régulière qui correspond à des chaînes comme ||||||||où le nombre de |est premier. Je lui ai...
De nombreuses fonctions d'activation dans les réseaux de neurones (sigmoïde, tanh, softmax) sont monotones, continues et différenciables (à l'exception de quelques points, où la dérivée n'existe pas). Je comprends la raison de la continuité et de la différentiabilité, mais je ne peux pas vraiment...
J'ai à quelques reprises formé des réseaux de neurones (réseaux de rétropropagation) avec des ensembles de données assez compliqués (positions de backgammon et OCR). En faisant cela, il semble qu'une grande partie du travail implique d'essayer différentes configurations des réseaux, afin de trouver...
Le modèle d'apprentissage probablement correct (PAC) est défini comme suit: Une classe conceptuelle CCC est dit être PAC-apprenant s'il existe un algorithme AAA et une fonction polynomiale poly(⋅,⋅,⋅,⋅)poly(·,·,·,·)poly(·,·,·,·)de telle sorte que pour tout ε>0ε>0ε>0 et δ>0δ>0δ>0 , pour...
Je suis très nouveau dans les réseaux de neurones et j'ai essayé de comprendre certaines choses. Donc, disons que vous rencontrez un réseau de neurones qui a 100 entrées, une couche cachée avec 200 nœuds et 32 sorties. Disons également que vous, le «découvreur» de cette instance particulière d'un...
J'ai récemment découvert le Q-learning, une technique d'apprentissage par renforcement qui estime directement la valeur attendue d'une action dans un état. Je me demande s'il existe des techniques pour faire de "l'apprentissage dynamique", afin d'estimer la dynamique d'un système. Un agent...
Plusieurs algorithmes d'apprentissage automatique populaires tels que la régression logistique ou les réseaux de neurones nécessitent que ses entrées soient numériques. Ce qui m'intéresse, c'est comment vous faites fonctionner ces algorithmes sur des entrées non numériques (telles que des chaînes...
Je lis donc "Introduction to Machine Learning" 2e édition, par Bishop, et. tout. À la page 27, ils discutent de la dimension Vapnik-Chervonenkis qui est, "Le nombre maximum de points qui peuvent être brisés par H [la classe d'hypothèses] est appelé la dimension Vapnik-Chervonenkis (VC) de H, est...