Quel est le nom de l'opérateur qui prend un vecteur catégorique et le transforme en représentation binaire en utilisant un codage à chaud? Je me demande depuis que j'écris un article scientifique et j'ai besoin d'un nom propre pour cela.
terminology
categorical-encoding
fractile
la source
la source
Réponses:
Les statisticiens appellent le codage à chaud comme codage factice . Comme d'autres l'ont suggéré (y compris Scortchi dans les commentaires), ce n'est pas un synonyme exact, mais c'est le terme qui serait généralement utilisé pour les variables catégorielles codées 0-1.
Voir aussi: "Variable fictive" versus "variable indicatrice" pour les données nominales / catégorielles
la source
Cela dépend de votre public cible.
Comme l'a dit Tim , les statisticiens appellent cela un codage factice, et c'est ce que je m'attendrais à voir en décrivant quelque chose comme un modèle de régression. "Des variables codées factices ont été incluses pour s'adapter à l'emplacement du magasin." Je pense que l'appeler un encodage à chaud semble un peu étrange ici.
Cependant, comme un autre Tim l'a également dit, l'encodage à chaud est assez courant dans la littérature sur l'apprentissage automatique. Cela implique à peine l'existence de nœuds (comme dans un réseau neuronal), de fils physiques (dans un appareil), ou quelque chose comme ça, du moins pour moi.
la source
Le terme vient de l'ingénierie électronique. Pensez simplement à qui appellerait 1 "chaud"? Seuls ceux qui travaillent avec l'électricité, où "chaud" ou "vivant" signifie qu'il y a un potentiel électrique sur le fil . "Un chaud" se réfère à la conception du circuit où le niveau de signal électrique discret sur un fil serait décodé en chaud / froid sur un ensemble de fils. Je suppose que certaines personnes en apprentissage automatique avec une expérience en EE ont trouvé l'analogie convaincante.
En économétrie et des statistiques que vous pouvez rencontrer
dummy
ouindicator
variables, qui sont assez similaires car ceux - ci sont utilisés pour représenter des catégories distinctes avec leurs indicateurs distincts. Il y a cependant une différence subtile. Par exemple, vous créez des variables factices K-1 pour les catégories K, car la catégorie de base correspond à toutes les variables muettes définies sur 0. En revanche, je pense que dans un encodage à chaud, vous avez K fils, où la catégorie de base aura son propre fil ( variable).la source
Je suis statistiquement formé et j'ai récemment entendu parler de "l'encodage à chaud" en apprentissage automatique / sci lit. Je viens généralement de désigner la matrice à un point comme une matrice de conception / matrice de données / cadre de conception.
la source
En sciences physiques et en génie, on l'appelle le delta (généralisé) de Kronecker .
Le delta de Kronecker est vraiment utile dans Sigma / Pi / Einstein / etc. notations car il permet de spécifier les termes de manière conditionnelle.
Juste pour relier cela aux structures de programmation communes, le delta de Kronecker
condition?1:0
, où se?:
trouve l' opérateur conditionnel .la source
Voici une citation du livre,
la source