Existe-t-il une ressource avec une liste de techniques d'ingénierie des fonctionnalités? Une cartographie du type de données, du modèle et de la technique d'ingénierie des caractéristiques serait une mine d'or
feature-selection
feature-extraction
feature-engineering
feature-construction
featurization
icm
la source
la source
Réponses:
Il n'y a pas de source précise sur la façon de faire l'ingénierie des fonctionnalités. Cela dépend souvent du problème que vous essayez de résoudre. Certains disent que c'est plus un art qu'une science.
Mais je passerais en revue certaines des solutions de kaggle / solutions gagnantes les plus performantes si elles étaient disponibles. Rendez-vous à kaggle et parcourez les compétitions. Il y a beaucoup de matériel très utile là-dedans.
Le journal de recherche sur l'apprentissage automatique contient également de nombreux articles sur l'ingénierie des fonctionnalités. Recherchez simplement sur leur site http://www.jmlr.org/ .
Les liens suivants sont utiles et longs à paraphraser:
la source
Imputation de données manquante:
Analyse de cas complète
Imputation moyenne / médiane / mode
Imputation d'échantillons aléatoires
Remplacement par une valeur arbitraire
Indicateur de valeur manquante
Imputation multivariée
Encodage catégorique:
Un encodage à chaud
Nombre et encodage de fréquence
Encodage cible / encodage moyen
Encodage ordinal
Poids de la preuve
Encodage d'étiquette rare
BaseN, fonction de hachage et autres
Transformation variable:
Logarithme
Réciproque
Racine carrée
Exponentiel
Yeo-Johnson
Box-Cox
Discrétisation:
Discrétisation à fréquence égale
Discrétisation de longueur égale
Discrétisation avec des arbres
Discrétisation avec ChiMerge
Suppression des valeurs aberrantes:
Suppression des valeurs aberrantes
Traiter les valeurs aberrantes comme NaN
Plafonnement, Windsorisation
Mise à l'échelle des fonctionnalités:
Standardisation
Mise à l'échelle MinMax
Mise à l'échelle moyenne
Mise à l'échelle absolue maximale
Normalisation des unités
Ingénierie de la date et de l'heure:
Création de fonctionnalités:
Agrégation des données de transaction:
Extraire des fonctionnalités du texte:
Sac de mots
tfidf
n-grammes
word2vec
extraction de sujet
Et enfin extraire des fonctionnalités à partir d'images.
Un bon article décrivant la plupart des techniques ci-dessus: Ingénierie des fonctionnalités un aperçu complet
Une bonne liste de ressources pour en savoir plus sur l'ingénierie des fonctionnalités: Meilleures ressources pour en savoir plus sur l'ingénierie des fonctionnalités
Les outils Python pour l'ingénierie des fonctionnalités peuvent être trouvés dans ce fil
AVERTISSEMENT: J'ai écrit les 2 articles, et je suis également le créateur de 1 des cours recommandés pour en savoir plus sur l'ingénierie des fonctionnalités.
la source