Liste des techniques d'ingénierie des fonctionnalités

Réponses:

10

Il n'y a pas de source précise sur la façon de faire l'ingénierie des fonctionnalités. Cela dépend souvent du problème que vous essayez de résoudre. Certains disent que c'est plus un art qu'une science.

Mais je passerais en revue certaines des solutions de kaggle / solutions gagnantes les plus performantes si elles étaient disponibles. Rendez-vous à kaggle et parcourez les compétitions. Il y a beaucoup de matériel très utile là-dedans.

Le journal de recherche sur l'apprentissage automatique contient également de nombreux articles sur l'ingénierie des fonctionnalités. Recherchez simplement sur leur site http://www.jmlr.org/ .

Les liens suivants sont utiles et longs à paraphraser:

  • Vous trouverez quelques informations sur les meilleures pratiques d'ingénierie des fonctionnalités sur Quora, voir ce lien
  • À la maîtrise de l'apprentissage automatique, il y a cette page sur l'ingénierie des fonctionnalités.
phiver
la source
3

Imputation de données manquante:

  1. Analyse de cas complète

  2. Imputation moyenne / médiane / mode

  3. Imputation d'échantillons aléatoires

  4. Remplacement par une valeur arbitraire

  5. Indicateur de valeur manquante

  6. Imputation multivariée

Encodage catégorique:

  1. Un encodage à chaud

  2. Nombre et encodage de fréquence

  3. Encodage cible / encodage moyen

  4. Encodage ordinal

  5. Poids de la preuve

  6. Encodage d'étiquette rare

  7. BaseN, fonction de hachage et autres

Transformation variable:

  1. Logarithme

  2. Réciproque

  3. Racine carrée

  4. Exponentiel

  5. Yeo-Johnson

  6. Box-Cox

Discrétisation:

  1. Discrétisation à fréquence égale

  2. Discrétisation de longueur égale

  3. Discrétisation avec des arbres

  4. Discrétisation avec ChiMerge

Suppression des valeurs aberrantes:

  1. Suppression des valeurs aberrantes

  2. Traiter les valeurs aberrantes comme NaN

  3. Plafonnement, Windsorisation

Mise à l'échelle des fonctionnalités:

  1. Standardisation

  2. Mise à l'échelle MinMax

  3. Mise à l'échelle moyenne

  4. Mise à l'échelle absolue maximale

  5. Normalisation des unités

Ingénierie de la date et de l'heure:

  1. Extraction des jours, mois, années, trimestres, temps écoulé

Création de fonctionnalités:

  1. Somme, soustraction, moyenne, min, max, produit, quotient du groupe de caractéristiques

Agrégation des données de transaction:

  1. Identique à ci-dessus mais dans la même fonctionnalité sur la fenêtre de temps

Extraire des fonctionnalités du texte:

  1. Sac de mots

  2. tfidf

  3. n-grammes

  4. word2vec

  5. extraction de sujet

Et enfin extraire des fonctionnalités à partir d'images.

Un bon article décrivant la plupart des techniques ci-dessus: Ingénierie des fonctionnalités un aperçu complet

Une bonne liste de ressources pour en savoir plus sur l'ingénierie des fonctionnalités: Meilleures ressources pour en savoir plus sur l'ingénierie des fonctionnalités

Les outils Python pour l'ingénierie des fonctionnalités peuvent être trouvés dans ce fil

AVERTISSEMENT: J'ai écrit les 2 articles, et je suis également le créateur de 1 des cours recommandés pour en savoir plus sur l'ingénierie des fonctionnalités.

Sole G
la source