Dans SVM, le noyau gaussien est défini comme: où x, y \ in \ mathbb {R ^ n} . Je ne connais pas l'équation explicite de \ phi . Je veux le savoir.K( x , y) = exp( - ∥ x - y∥222 σ2) =ϕ(x )Tϕ (
Dans SVM, le noyau gaussien est défini comme: où x, y \ in \ mathbb {R ^ n} . Je ne connais pas l'équation explicite de \ phi . Je veux le savoir.K( x , y) = exp( - ∥ x - y∥222 σ2) =ϕ(x )Tϕ (
Selon ceci et cette réponse, les auto-encodeurs semblent être une technique qui utilise des réseaux de neurones pour réduire les dimensions. Je voudrais en outre savoir ce qu'est un autoencodeur variationnel (ses principales différences / avantages par rapport à un autoencodeur "traditionnel") et...
Quelle est la méthode d'échantillonnage la plus appropriée pour évaluer la performance d'un classificateur sur un ensemble de données particulier et la comparer avec d'autres classificateurs? La validation croisée semble être une pratique standard, mais j'ai lu que des méthodes telles que le...
Je sais que ma question / titre n'est pas très précis, je vais donc essayer de le clarifier: Les réseaux de neurones artificiels ont des conceptions relativement strictes. Bien sûr, généralement, ils sont influencés par la biologie et tentent de construire un modèle mathématique de réseaux...
Différents logiciels d'implémentation sont disponibles pour le lasso . Je sais que beaucoup de choses ont été discutées entre l'approche bayésienne et l'approche fréquentiste dans différents forums. Ma question est très spécifique au lasso - Quelles sont les différences ou les avantages du lasso...
C'est une question récurrente (voir cet article , cet article et cet article ), mais j'ai un tour différent. Supposons que j'ai un tas d'échantillons d'un échantillonneur MCMC générique. Pour chaque échantillon , je connais la valeur du log vraisemblance et du log prior . Si cela aide, je connais...
J'ai 50 000 images comme celles-ci: Ils représentent des graphiques de données. Je voulais extraire des fonctionnalités de ces images, j'ai donc utilisé le code de l'encodeur automatique fourni par Theano (deeplearning.net). Le problème est que ces encodeurs automatiques ne semblent pas apprendre...
Lors de la construction d'un modèle prédictif à l'aide de techniques d'apprentissage automatique, quel est l'intérêt de faire une analyse exploratoire des données (EDA)? Est-il correct de passer directement à la génération de fonctionnalités et à la construction de votre (vos) modèle (s)? Quelle...
Quelle est la façon la plus simple de comprendre le boosting? Pourquoi ne stimule-t-il pas les classificateurs très faibles "à l'infini" (la
Je recherche une alternative aux arbres de classification qui pourrait donner un meilleur pouvoir prédictif. Les données dont je traite ont des facteurs à la fois pour les variables explicatives et expliquées. Je me souviens avoir rencontré des forêts aléatoires et des réseaux de neurones dans ce...
Récemment, je courais et j'apprenais le flux tenseur et j'ai obtenu quelques histogrammes que je ne savais pas interpréter. Habituellement, je pense à la hauteur des barres comme à la fréquence (ou fréquence relative / comptes). Cependant, le fait qu'il n'y ait pas de barres comme dans un...
Je participe à des compétitions de modélisation prédictive sur Kaggle , TunedIt et CrowdAnalytix . Je trouve que ces sites sont un bon moyen de "travailler" pour les statistiques / l'apprentissage automatique. Y a-t-il d'autres sites que je devrais connaître? Que pensez-vous tous des compétitions...
Quelqu'un peut-il expliquer suffisamment de statistiques en termes très basiques? Je viens d'un milieu d'ingénierie et j'ai traversé beaucoup de choses mais je n'ai pas réussi à trouver une explication
Récemment, il y a eu une question de type ML sur cstheory stackexchange, et j'ai posté une réponse recommandant la méthode de Powell, la descente de gradient, les algorithmes génétiques ou autres "algorithmes d'approximation". Dans un commentaire, quelqu'un m'a dit que ces méthodes étaient des...
Je pense qu'une hypothèse de base de l'apprentissage automatique ou de l'estimation des paramètres est que les données invisibles proviennent de la même distribution que l'ensemble d'apprentissage. Cependant, dans certains cas pratiques, la distribution de l'ensemble de test sera presque différente...
La définition du paramètre min_child_weight dans xgboost est donnée comme: somme minimale du poids d'instance (toile de jute) nécessaire chez un enfant. Si l'étape de partition d'arborescence aboutit à un nœud feuille avec la somme du poids d'instance inférieure à min_child_weight, le processus de...
Je fais des recherches sur les techniques d'optimisation pour l'apprentissage automatique, mais je suis surpris de constater qu'un grand nombre d'algorithmes d'optimisation sont définis en fonction d'autres problèmes d'optimisation. J'illustre quelques exemples dans ce qui suit. Par exemple...
Dans un certain sens, c'est une croix de ma part de math.stackexchange , et j'ai le sentiment que ce site pourrait fournir un large public. Je recherche une introduction mathématique au machine learning. En particulier, beaucoup de littérature qui peut être trouvée est relativement imprécise et...
Je travaille sur un projet où je souhaite extraire des informations sur le contenu d'une série d'essais ouverts. Dans ce projet particulier, 148 personnes ont écrit des essais sur une organisation étudiante hypothétique dans le cadre d'une expérience plus vaste. Bien que dans mon domaine...
Chaque manuel que j'ai vu jusqu'à présent décrit les algorithmes ML et comment les implémenter. Existe-t-il également un manuel qui construit des théorèmes et des preuves du comportement de ces algorithmes? Par exemple, en déclarant que dans les conditions , la descente de gradient conduira...