Variable indicatrice pour les données binaires: {-1,1} vs {0,1}

10

Je suis intéressé par les interactions traitement covariables dans le cadre d'expériences / essais contrôlés randomisés, avec un indicateur de traitement binaire assignation .T

En fonction de la méthode / source spécifique, j'ai vu respectivement et T = { 1 , - 1 } pour les sujets traités et non traités.T={1,0}T={1,1}

Existe-t-il une règle de base pour utiliser ou { 1 , - 1 } ?{1,0}{1,1}

En quoi l'interprétation diffère-t-elle?

cecefuss
la source
FWIW ... Ce premier lien donne un aperçu assez complet des différents schémas de codage ... ats.ucla.edu/stat/r/library/contrast_coding.htm Ce deuxième lien traite des codes d' indicateur (factice), d'effet et orthogonal (contraste) ... faculty.cas.usf.edu/mbrannick/regression/anova1.html
Mike Hunter

Réponses:

10

L'interprétation de l'estimateur de la variable indicatrice et de l'ordonnée à l'origine diffère. Commençons par :{1,0}

Disons que vous avez le modèle suivant

yi=β0+treatmentβ1

treatment={0if placebo1if drug

Dans ce cas, vous vous retrouvez avec les formules suivantes pour :yi

yi={β0+0β1=β0if placeboβ0+1β1=β0+β1if drug

L'interprétation de est donc l'effet du placebo et l'interprétation de β 1 est la différence entre l'effet du placebo et l'effet du médicament. En effet, vous pouvez interpréter β 1 comme l'amélioration que le médicament offre.β0β1β1


Voyons maintenant :{1,1}

Vous avez alors (à nouveau) le modèle suivant:

yi=β0+treatmentβ1

mais où

treatment={1if placebo1if drug

yi

yi={β0+1β1=β0β1if placeboβ0+1β1=β0+β1if drug

β0β1


Alors, lequel utilisez-vous?

β0{0,1}

Mais au final, tout est affaire d'interprétation, ce que j'ai expliqué plus haut. Vous devez donc évaluer vos hypothèses et vérifier quelle interprétation rend le tirage des conclusions le plus simple.

JAD
la source
6
La constante lors de l'utilisation du codage -1, 1 est la moyenne si le nombre de répondants dans le groupe traité est le même que le nombre de répondants dans le groupe témoin.
Maarten Buis
y
9
Utile. J'essaie toujours d'encourager l'utilisation du mot indicateur plutôt que factice (comme dans la question d'origine!) Pour au moins deux raisons. Tout d'abord, j'ai entendu trop d'histoires dans lesquelles les présentations ont très mal tourné parce que des termes tels que «mannequin de genre» ont été mal interprétés comme étant dénigrants ou offensants par des personnes moins techniques. Deuxièmement, le terme mannequin donne à l'ensemble de l'appareil un aspect de fudge ou d'esquive, alors qu'il s'agit d'une méthode parfaitement propre et élégante. Je n'ai pas beaucoup de chance de changer des pratiques bien ancrées dans certains domaines, mais voici en train d'essayer.
Nick Cox
D'accord, cela semble plus professionnel aussi. De plus, c'est une meilleure description de ce qu'il fait réellement.
JAD
2
Content que vous soyez d'accord. Voici une façon simple de l'expliquer: ça s'appelle un indicateur car ça indique!
Nick Cox
6

xi{0,1}

yi{1,1}

Essayez d'utiliser la notation standard pour tout ce que vous faites / utilisez.


XX~=XAAAy^

Matthew Gunn
la source
{1,1}
yi{1,1}
5
{1,1}
@matthewgunn L'auteur parle des covariables, c'est-à-dire des entrées et non des sorties. Le {-1, 1} a du sens pour les vecteurs de support pour la sortie mais cela n'a pas d'importance pour l'entrée. Voir ici: en.wikipedia.org/wiki/Support_vector_machine#Linear_SVM
Francisco Arceo
@FranciscoArceo Point pris; J'ai édité pour être plus précis.
Matthew Gunn
2

C'est plus abstrait (et peut-être inutile), mais je noterai que ces deux représentations sont, au sens mathématique, en fait des représentations de groupe, et qu'il y a un isomorphisme entre elles.

TT1T2T1T2Z21,01,1ab=1(a+b)ab=abϕ(a)=2a1

pTTTpp=pp+(1p)(1p)t(p)=2p1tt=ttt

jwimberley
la source
C'est impressionnant, mais je trouve suffisant de remarquer que toute correspondance valide entre {-1, 1} et {0, 1} doit être une à une: il n'est pas nécessaire d'invoquer quoi que ce soit au-delà des mathématiques du secondaire. Nous parlons nécessairement des mêmes informations, simplement codées différemment.
Nick Cox