Comment obtenir une importance variable (attribut) en utilisant SVM?
Comment obtenir une importance variable (attribut) en utilisant SVM?
Je suis un peu confus avec une conférence sur la régression linéaire donnée par Andrew Ng sur Coursera sur l'apprentissage automatique. Là, il a donné une fonction de coût qui minimise la somme des carrés comme suit: 12m∑i=1m(hθ(X(i))−Y(i))212m∑i=1m(hθ(X(i))−Y(i))2 \frac{1}{2m} \sum _{i=1}^m...
J'ai travaillé sur un problème de régression où l'entrée est une image et l'étiquette est une valeur continue entre 80 et 350. Les images sont de certains produits chimiques après qu'une réaction ait lieu. La couleur qui apparaît indique la concentration d'un autre produit chimique qui reste, et...
Je suis complètement nouveau dans les réseaux de neurones mais très intéressé à les comprendre. Cependant, ce n'est pas facile du tout de commencer. Quelqu'un pourrait-il recommander un bon livre ou tout autre type de ressource? Y a-t-il une lecture obligatoire? Je suis reconnaissant pour tout type...
Lors de la régression, par exemple, deux hyper paramètres à choisir sont souvent la capacité de la fonction (par exemple, le plus grand exposant d’un polynôme) et la quantité de régularisation. Pourquoi ne pas simplement choisir une fonction à faible capacité, puis ignorer toute régularisation? De...
Existe-t-il une implémentation populaire de champs aléatoires conditionnels en Python ? Je n'arrive pas à en trouver qui soient largement utilisés et
Je suis tombé sur un article qui utilise la détection d'anomalie de lien pour prédire les sujets à la mode et je l'ai trouvé extrêmement intriguant: Cet article s'intitule "Découvrir les sujets émergents dans les flux sociaux via la détection d'anomalie de lien" . J'adorerais le reproduire sur un...
Je voudrais déterminer l'importance relative des ensembles de variables par rapport à un randomForestmodèle de classification dans R. La importancefonction fournit la MeanDecreaseGinimétrique pour chaque prédicteur individuel - est-ce aussi simple que de les additionner à travers chaque prédicteur...
J'utilise l'outil libsvm ( http://www.csie.ntu.edu.tw/~cjlin/libsvm/ ) pour prendre en charge la classification des vecteurs. Cependant, je suis confus quant au format des données d'entrée. Du README: Le format du fichier de données de formation et de test est: <label>
Le «deep learning» n'est-il qu'un autre terme pour la modélisation multi-niveaux / hiérarchique? Je connais beaucoup mieux ce dernier que le premier, mais d'après ce que je peux dire, la principale différence n'est pas dans leur définition, mais dans la façon dont ils sont utilisés et évalués dans...
J'ai un CNN à quatre couches pour prédire la réponse au cancer à l'aide de données IRM. J'utilise les activations ReLU pour introduire des non-linéarités. La précision et la perte du train augmentent et diminuent de façon monotone respectivement. Mais, ma précision de test commence à fluctuer...
J'essayais d'apprendre l'apprentissage automatique en utilisant le matériel Coursera . Dans cette conférence, Andrew Ng utilise un algorithme de descente de gradient pour trouver les coefficients du modèle de régression linéaire qui minimiseront la fonction d'erreur (fonction de coût). Pour la...
Quelles sont les différences entre "inférence" et "estimation" dans le contexte de l'apprentissage automatique ? En tant que débutant, je pense que nous déduisons des variables aléatoires et estimons les paramètres du modèle. Ma compréhension est-elle juste? Sinon, quelles sont exactement les...
[Cette question a également été posée au débordement de la pile] La question en bref J'étudie les réseaux de neurones convolutifs, et je crois que ces réseaux ne traitent pas chaque neurone d'entrée (pixel / paramètre) de manière équivalente. Imaginez que nous ayons un réseau profond (plusieurs...
Je lisais l'article ImageNet Classification with Deep Convolutional Neural Networks et dans la section 3, ils expliquaient l'architecture de leur Convolutional Neural Network, ils expliquaient comment ils préféraient utiliser: non linéarité non saturanteF( x ) = m a x ( 0 , x )...
J'essaye d'obtenir jusqu'à la vitesse avec R. Je veux finalement utiliser les bibliothèques R pour faire la classification de texte. Je me demandais simplement quelles sont les expériences des gens en ce qui concerne l'évolutivité de R quand il s'agit de faire une classification de texte. Je suis...
J'avais une question sur le paramètre de profondeur d'interaction en gbm dans R. Cela peut être une question noob, pour laquelle je m'excuse, mais comment le paramètre, qui je crois dénote le nombre de nœuds terminaux dans un arbre, indique fondamentalement X-way interaction entre les prédicteurs?...
Enseignement supervisé 1) Un humain construit un classificateur basé sur des données d' entrée et de sortie 2) Ce classificateur est formé avec un ensemble de données de formation 3) Ce classificateur est testé avec un ensemble de données de test 4) Déploiement si le résultat est satisfaisant A...
Quelle est la différence entre le réseau neuronal , le réseau bayésien , l' arbre de décision et les réseaux de Petri , même s'ils sont tous des modèles graphiques et décrivent visuellement la relation de cause à
J'ai beaucoup de chaînes d'adresse: 1600 Pennsylvania Ave, Washington, DC 20500 USA Je veux les analyser dans leurs composants: street: 1600 Pennsylvania Ave city: Washington province: DC postcode: 20500 country: USA Mais bien sûr, les données sont sales: elles proviennent de nombreux pays dans de...