«Variable factice» et «variable indicatrice» sont des termes fréquemment utilisés pour décrire l'appartenance à une catégorie avec un codage 0/1; généralement 0: pas un membre de la catégorie, 1: membre de la catégorie.
Le 26/11/2014, une recherche rapide sur scholar.google.com (avec guillemets inclus) révèle que "variable fictive" est utilisée dans environ 318 000 articles, et "variable indicatrice" est utilisée dans environ 112 000 articles. Le terme "variable fictive" a également une signification dans les mathématiques non statistiques de " variable liée " qui contribue probablement à une plus grande utilisation de "variable fictive" dans les articles indexés.
Mes questions liées à l'actualité:
- Ces termes sont-ils toujours synonymes (dans les statistiques)?
- Sont l' un de ces termes jamais appliquées à d' autres acceptablement formes de codage catégoriques (par exemple , effectuer le codage , le codage Helmert, etc. )?
- Quelles sont les raisons statistiques ou disciplinaires de préférer un terme à l'autre?
male
avec des valeurs1
ou0
. S'il existe une variable catégorielle avec plus de 2 catégories qui est ensuite développée en variables d'indicateur pour l'appartenance à chaque niveau, j'utiliserais des "variables factices" pour décrire cet ensemble de variables d'indicateur.sex
.male
, où 1 signifie vrai (dans ce cas, masculin) et 0 signifie faux (dans ce cas, féminin). Si j'utilise le nom de la variable,sex
je devrai chercher comment j'ai codé cette variable chaque fois que je reviens à cet ensemble de données.Réponses:
Je dirais que «variable fictive» est une façon plus générale de faire référence à (une des) variable (s) numérique (s) qui représentent (représentent ensemble) un prédicteur catégorique; par conséquent, le terme s'applique également à ceux utilisés dans le codage Helmert & effect † . Cela est principalement dû à l'utilisation générale de "factice" pour signifier "stand-in". «Variable d'indicateur» Je me rapporte aux fonctions d'indicateur ‡ — donc celles-ci ne peuvent être qu'un ou zéro pour indiquer avoir ou non une propriété; par conséquent, le terme ne s'applique qu'à ceux utilisés dans le codage de niveau de référence ※ . Bien sûr, certaines personnes utilisent "codage factice" pour signifier "codage au niveau de référence"; ils ont vraisemblablement une définition plus restreinte des "variables muettes", ou du moins devraient avoir.
† Et si vous n'appelez pas ces "nuls", comment les appelez-vous?
※ Ou, comme l'a souligné @gung, le codage de niveau signifie.
la source
la source