Quelqu'un peut-il suggérer quelle est la bonne étape pour supprimer les variables corrélées avant l'ingénierie des fonctionnalités ou après l'ingénierie des
Quelqu'un peut-il suggérer quelle est la bonne étape pour supprimer les variables corrélées avant l'ingénierie des fonctionnalités ou après l'ingénierie des
Je voudrais exécuter un modèle d'apprentissage automatique comme la forêt aléatoire, le renforcement du gradient ou SVM sur mon jeu de données. Il y a plus de 200 variables prédictives dans mon jeu de données et mes classes cibles sont une variable binaire. Dois-je exécuter la sélection des...
En essayant de faire par exemple une classification, mon approche est actuellement de essayez d'abord différents algorithmes et comparez-les effectuer la sélection des fonctionnalités sur le meilleur algorithme parmi 1 régler les paramètres en utilisant les fonctionnalités et l'algorithme...
Je construis souvent un modèle (classification ou régression) où j'ai des variables prédictives qui sont des séquences et j'ai essayé de trouver des recommandations techniques pour les résumer de la meilleure façon possible pour les inclure comme prédicteurs dans le modèle. À titre d'exemple...
Je recherche un site internet ou un livre où plusieurs exemples pratiques sont donnés pas à pas, expliquant comment ils choisissent les fonctionnalités pertinentes, la procédure de sélection des modèles, etc
Le graphique suivant montre les coefficients obtenus par régression linéaire (avec mpgcomme variable cible et tous les autres comme prédicteurs). Pour le jeu de données mtcars ( ici et ici ) avec et sans mise à l'échelle des données: Comment interpréter ces résultats? Les variables hpet ne dispsont...
L'une des méthodes pour sélectionner un sous-ensemble de vos fonctionnalités disponibles pour votre classificateur consiste à les classer en fonction d'un critère (tel que le gain d'informations), puis à calculer la précision à l'aide de votre classificateur et d'un sous-ensemble des...
J'ai deux tenseur a:[batch_size, dim] b:[batch_size, dim]. Je veux faire un produit intérieur pour chaque paire du lot, en générant c:[batch_size, 1], où c[i,0]=a[i,:].T*b[i,:].
Il existe plusieurs approches de sélection de caractéristiques / sélection de variables (voir par exemple Guyon et Elisseeff, 2003 ; Liu et al., 2010 ): méthodes de filtrage (par exemple, basées sur la corrélation, basées sur l'entropie, basées sur l'importance aléatoire des forêts), les méthodes...
Disons que nous prédisons les ventes d'une boutique et que mes données de formation ont deux ensembles de fonctionnalités: Un sur les ventes du magasin avec les dates (le champ "Store" n'est pas unique) Un sur les types de magasins (le champ "Store" est unique ici) La matrice ressemblerait donc à...
J'ai lu l' explication de la convolution et je la comprends dans une certaine mesure. Quelqu'un peut-il m'aider à comprendre comment cette opération est liée à la convolution dans les réseaux neuronaux convolutionnels? Le filtre est-il une fonction gqui applique du
J'ai des ensembles de données qui contiennent, parmi de nombreuses fonctionnalités, des coordonnées GPS (latitude et longitude). Je voudrais utiliser ces ensembles de données pour explorer des problèmes tels que: (1) calculer l'ETA pour conduire entre les points de début et de fin; et (2) estimer...
Fermé . Cette question doit être plus ciblée . Il n'accepte pas actuellement les réponses. Voulez-vous améliorer cette question? Mettez à jour la question afin qu'elle se concentre sur un problème uniquement en modifiant ce message . Fermé il y a 5 ans . Il semble que la plupart des langues...
J'ai un grand nombre d'échantillons qui représentent des flux binaires encodés Manchester sous forme de signaux audio. La fréquence à laquelle ils sont codés est la composante de fréquence principale lorsqu'elle est élevée, et il y a une quantité constante de bruit blanc en arrière-plan. J'ai...
Ma question est triple Dans le cadre des machines à vecteurs de support "Kernelized" La sélection des variables / fonctionnalités est-elle souhaitable - d'autant plus que nous régularisons le paramètre C pour éviter le sur-ajustement et que le principal motif derrière l'introduction de noyaux dans...
Existe-t-il une ressource avec une liste de techniques d'ingénierie des fonctionnalités? Une cartographie du type de données, du modèle et de la technique d'ingénierie des caractéristiques serait une mine
Appliqué Lasso pour classer les fonctionnalités et obtenu les résultats suivants: rank feature prob. ================================== 1 a 0.1825477951589229 2 b 0.07858498115577893 3 c 0.07041793111843796 Notez que l'ensemble de données a 3 étiquettes. Le classement des fonctionnalités pour les...
Je développe un système qui vise à capturer le "contexte" de l'activité des utilisateurs dans une application; il s'agit d'un cadre que les applications Web peuvent utiliser pour baliser l'activité des utilisateurs en fonction des demandes adressées au système. On espère que ces données pourront...
J'ai un projet de classification de documents dans lequel j'obtiens le contenu du site, puis j'attribue l'une des nombreuses étiquettes au site Web en fonction du contenu. J'ai découvert que tf-idf pouvait être très utile pour cela. Cependant, je ne savais pas exactement quand l' utiliser. En...