Est-il valide d’inclure une mesure de référence en tant que variable de contrôle lors du test de l’effet d’une variable indépendante sur les scores de changement?

38

J'essaie d'exécuter une régression OLS:

  • DV: Variation du poids sur un an (poids initial - poids final)

  • IV: Que vous exerciez ou non.

Cependant, il semble raisonnable que les personnes plus lourdes perdent plus de poids par unité d'exercice que les personnes plus minces. Ainsi, je voulais inclure une variable de contrôle:

  • CV: Poids de départ initial.

Cependant, maintenant, le poids initial est utilisé À LA FOIS pour calculer la variable dépendante ET en tant que variable de contrôle.

Est-ce correct? Cela enfreint-il une hypothèse de MCO?

ChrisStata
la source
4
Le traitement a-t-il été attribué au hasard?
Andy W
1
Notez qu'un autre très similaire a récemment été demandé, stats.stackexchange.com/q/15104/1036 . La réponse à cette question est applicable à cette question (en fait, je dirais que ce sont des questions en double).
Andy W
3
@Andy En fait, les deux questions sont suffisamment différentes pour que je donne une réponse différente de celle que j'ai donnée à l'autre. Charlie a déjà fait une belle analyse ici.
whuber
3
Notez que l'utilisation de scores de différence est généralement associée à une réduction substantielle de la fiabilité, bien que cela
fasse l'

Réponses:

25

Pour répondre à votre question littérale, "Est-il valide d'inclure une mesure de base en tant que variable de contrôle lors du test de l'effet d'une variable indépendante sur les scores de changement?", La réponse est non . La réponse est non, car, par construction, le score de référence est corrélé au terme d'erreur lorsque le score de changement est utilisé comme variable dépendante. Par conséquent, l'effet estimé de la référence sur le score de changement est ininterprétable.

En utilisant

  • Y1 comme poids initial
  • Y2 comme poids final
  • tant que changement de poids (c.-à-d. Δ Y = Y 2 - Y 1 )ΔYΔY=Y2Y1
  • commetraitementassigné au hasard, etT
  • tant qu'autres facteurs exogènes ayant une incidence sur le poids (par exemple, d'autres variables de contrôle liées au résultat mais qui ne doivent pas être corrélées avec le traitement en raison d'une assignation aléatoire)X

On a alors un modèle régressant sur T et X ;ΔYTX

ΔY=β1T+β2X+e

Qui par définition est équivalent à;

Y2Y1=β1T+β2X+e

Maintenant, si vous incluez la ligne de base en tant que covariable, vous devriez voir un problème, en ce sens que vous avez le terme deux côtés de l'équation. Cela montre que β 3 Y 1 est ininterprétable, car il est intrinsèquement corrélé au terme d'erreur.Y1β3Y1

Y2Y1=β1T+β2X+β3Y1+eY2=β1T+β2X+β3Y1+(e+Y1)

Or, une partie de la confusion dans les différentes réponses semble provenir du fait que différents modèles donneront des résultats identiques pour l’ effet du traitement , dans la formulation ci-dessus. Ainsi, si l’on comparait l’effet du traitement pour le modèle en utilisant les scores de changement comme variable dépendante du modèle en utilisant les "niveaux" (chaque modèle incluant la ligne de base Y 1 en tant que covariable), l’interprétation de l’effet du traitement serait: le même. Dans les deux modèles qui suivent, β 1 T sera identique, de même que les inférences basées sur ces modèles (Bruce Weaver a affiché du code SPSS démontrant également l'équivalence).β1TY1β1T

Change Score Model:Y2Y1=β1T+β2X+β3Y1+eLevels Model:Y2=β1T+β2X+β3Y1+e

Certains diront donc (comme Felix dans ce fil, et comme Bruce Weaver l’a fait lors de discussions sur le groupe google SPSS) que, étant donné que les modèles produisent le même effet de traitement estimé, peu importe celui que vous choisissez. Je ne suis pas d'accord, car la covariable de base dans le modèle de score de changement ne peut pas être interprétée, vous ne devez jamais inclure la référence comme covariable (que l'effet estimé du traitement soit identique ou non). Cela soulève donc une autre question: à quoi sert-il d'utiliser les scores de changement comme variables dépendantes? Comme Felix l'a déjà noté également, le modèle utilisant le score de changement comme variable dépendante excluant la ligne de base en tant que covariable est différent du modèle utilisant les niveaux. Pour clarifier, les modèles suivants donneront des effets de traitement différents (en particulier dans le cas où le traitement est corrélé avec la ligne de base);

Change Score Model Without Baseline:Y2Y1=β1T+β2X+eLevels Model:Y2=β1T+β2X+β3Y1+e

Cela a été noté dans la littérature antérieure comme "Le paradoxe du Seigneur". Alors quel modèle a raison? Eh bien, dans le cas d'expériences randomisées, je dirais que le modèle Levels est préférable (bien que si vous faites du bon travail en randomisant, l'effet de traitement moyen devrait être très proche entre les modèles). D'autres ont noté les raisons pour lesquelles le modèle de niveaux est préférable, la réponse de Charlie montre clairement que vous pouvez estimer les effets d'interaction avec la ligne de base dans le modèle de niveaux (mais vous ne pouvez pas utiliser le modèle de score de changement). Whuber dans cette réponse à une question très similaire montre comment les scores de changement induisent des corrélations entre différents traitements.

Dans les situations où le traitement n'est pas attribué au hasard, le modèle utilisant des scores de changement comme variable dépendante devrait être davantage pris en compte. Le principal avantage du modèle de score de changement est que tous les prédicteurs invariants dans le temps du résultat sont contrôlés. Ainsi, dans la formulation ci-dessus, est constant dans le temps (par exemple, une prédisposition génétique à un certain poids) et X est en corrélation avec le fait qu'un individu choisisse de faire de l'exercice (et X n'est pas observé). Dans ce cas, le modèle de score de changement est préférable. De même, dans les cas où la sélection dans le traitement est corrélée à la valeur de base, le modèle de score de changement peut être préférable. Paul Allison dans son journal,XXXChanger les scores en tant que variables dépendantes dans l'analyse de régression donne ces mêmes exemples (et a largement influencé mon point de vue sur le sujet, je suggère donc vivement de le lire).

Cela ne veut pas dire que les scores de changement sont toujours préférables dans des contextes non randomisés. Si vous vous attendez à ce que la référence ait un effet causal réel sur le poids de la publication, vous devez utiliser le modèle des niveaux. Dans le cas où vous vous attendez à ce que la ligne de base ait un effet causal et que la sélection dans le traitement soit corrélée à la ligne de base, l'effet du traitement est confondu avec l'effet de ligne de base.

J'ai ignoré la note de Charlie selon laquelle le logarithme du poids pourrait être utilisé comme variable dépendante. Bien que je ne doute pas que cela pourrait être une possibilité, c'est en quelque sorte une question non séquentielle à la question initiale. Une autre question a porté sur le moment approprié pour utiliser les logarithmes de la variable (et ceux-ci s'appliquent toujours dans ce cas). Il existe probablement des publications antérieures sur le sujet qui pourraient vous aider à déterminer si l’utilisation du poids journalé est également appropriée.


Citation

Allison, Paul D. 1990. Variation des scores en tant que variables dépendantes dans l'analyse de régression . Sociology Methodology 20: 93-114. Version PDF publique .

Andy W
la source
3
Dans l'équation, si, comme c'est la pratique courante, nous supposons que toutes les covariables ne sont pas des variables aléatoires, alors Y 1 n'est pas corrélé avec e + Y 1 . Ainsi, je pense qu’il n’ya un problème que si vous considérez Y 1 comme aléatoire, auquel cas (encore une fois mon avis) vous devriez modéliser ( Y 1 , Y 2 )Y2=β1T+β2X+β3Y1+(e+Y1)Y1e+Y1Y1(Y1,Y2)conjointement mais sans comme covariable. À cet égard, sans données manquantes, on m'a informé que cette approche équivaut à ce que Y 1 soit une covariable fixe (je vais essayer de trouver quelques références pour cela). Y1Y1
dandar
1
@Dandar, cette déclaration n'a pas de sens pour moi. Notez que est la valeur du résultat avant traitement , ce n'est pas la variable manipulée dans une expérience. Voulez-vous dire que si j'ai la valeur de base Y 1 , puis-je mener une expérience et mesurer ensuite Y 2 , je devrais modéliser à la fois Y 1 et Y 2 en fonction de l'intervention expérimentale? Y1Y1Y2Y1Y2
Andy W
1
Le modèle dont je parle implique effectivement que est une fonction du traitement, mais uniquement du point de vue qui, malgré la randomisation, comportera toujours de légères différences entre le groupe traité et le groupe témoin en ce qui concerne leurs moyennes de référence. Ainsi, β 1 capturera cette différence ainsi que l’effet du traitement. La référence à cet égard est ("Analyse de données longitudinales sur les réponses continues et discrètes pour les plans pré-post" de Zeger et Liang, 2000). Y1β1
dandar
1
On trouvera une discussion claire de cet article dans («Le scénario de référence doit-il être une covariable ou une variable dépendante dans les analyses du changement par rapport au scénario de référence dans les essais cliniques?» Par Liu, Mogg, Mallick et Mehrotra 2009). Ils se réfèrent à ce modèle en tant que modèle inconditionnel (c'est-à-dire qu'il ne conditionne pas la réponse de base). Dans le document de Liu (2009), ils abordent les principaux résultats du document de Zeger (2000). Premièrement, sans aucune donnée manquante, les estimations ponctuelles de du modèle inconditionnel sont les mêmes que celles de l’approche conditionnelle de ANCOVA utilisant l’après-référenceB1
dandar le
1
mesure comme réponse et conditionnant sur une valeur de base fixe, et deuxièmement, la variance de l’évaluation ponctuelle du modèle ANCOVA est toujours supérieure ou égale à celle du modèle inconditionnel. Il s'avère que cette différence de variance sera généralement faible en raison de la randomisation, ce qui garantit que les réponses moyennes de base entre les groupes sont faibles. Les auteurs concluent que le modèle inconditionnel est approprié pour modéliser la ligne de base en tant que variable aléatoire, mais ANCOVA comme approprié lorsqu'il est considéré comme fixe.
dandar
21

La réponse d'Andy semble être le point de vue de l'économiste. Dans les essais cliniques, il est de pratique courante de s’ajuster presque toujours à la version de base de la variable de réponse afin d’accroître considérablement la puissance. Comme nous conditionnons les variables de base, il n’existe pas de «terme d’erreur» pour qu’elles soient confondues avec le terme d’erreur global. Le seul problème serait que les erreurs de mesure dans la covariable de base soient confondues avec un autre X, faussant ainsi les effets de cet autre X. La méthode généralement privilégiée consiste à ajuster le niveau de référence et à modéliser la variable de réponse, et non à calculer le changement. Une des raisons est que le changement dépend fortement de la transformation correcte de Y, et que ce changement ne s'applique pas aux modèles de régression en général. Par exemple, si Y est ordinale, la différence entre deux variables ordinales n'est plus ordinale.

Frank Harrell
la source
1
Je ne comprends pas bien cette réponse. Que voulez-vous dire par "ajuster en fonction de la base"? Prendre la différence ou en prendre le contrôle?
Henrik
3
Par «ajuster pour la ligne de base», je voulais dire y compris la ligne de base en tant que covariable. Il est également courant d'utiliser des scores de changement, mais vous ne pouvez pas les utiliser sans également ajuster la base de référence en tant que covariable (d'où l'intérêt de se soucier des scores de changement?).
Frank Harrell
6
En réalité, rien de ce que vous dites ici (ou en réponse aux commentaires de Felix) ne contredit directement ce que je dis. L'utilisation des scores de changement ne «s'ajuste pas à la ligne de base», elle contrôle toutes les variables omises invariantes dans le temps (ou si la sélection dans le traitement est fortement corrélée à la ligne de base). Si le niveau de référence n'est pas négligeable (c'est-à-dire qu'il a un effet causal direct sur le résultat ou qu'il a une interaction avec le traitement), les scores de changement ne résolvent pas le problème.
Andy W
2
@ Frank Harrell Merci d'avoir participé à cette discussion et de l'avoir clarifiée. (+1)
Henrik
8

E[w1w0X,w0]=β0+xβ+w0γE[w1X,w0]=β0+xβ+w0(γ+1)

xw0w0

E[w1w0X,w0]=β0+(xw0)β+w0γ.

log(w1)log(w0)r;
rxvous dirait comment ces prédicteurs sont liés aux changements de proportion de poids. Ceci "contrôle le poids" initial en disant que, par exemple, un régime d’exercice qui réduit le poids de 10% (un coefficient de 0,1 multiplié par 100%) pour une personne pesant 130 livres réduit le poids de 13 livres, alors que le programme réduit la poids d'un participant de 200 livres par 20 livres. Dans ce cas, vous n'aurez peut-être pas besoin d'inclure le poids initial (ou son journal) sur le côté droit.

w0w0β1β1

log(w0)β1/w0

Comme vous pouvez le constater, les inter-partiels sur les termes d'interaction peuvent devenir un peu difficiles à interpréter, mais ils peuvent capturer un impact qui vous intéresse.

Charlie
la source
Bonjour Charlie, je vois l'avantage d'utiliser le changement de proportion. Cependant, pourquoi trouvez-vous la différence entre les variables consignées plutôt que de simplement diviser w1 sur w0?
ChrisStata
J'aime l'idée de changement proportionnel. La question reste cependant de savoir si l'interaction attendue est littéralement proportionnelle ou non. Sinon, vous devrez quand même inclure le poids initial en tant que covariable. Ou seriez-vous sûr qu'il est aussi difficile de perdre 10% de votre poids pour une personne de 100 ou 200 livres?
Henrik
@ ChrisStata, vous pouvez le faire aussi. Je suis économiste et nous aimons nos journaux de bord (et la différenciation également). Si vous aviez une série chronologique (c.-à-d. Plusieurs observations) pour chaque personne (création d'un ensemble de données de panel), je pourrais dire que ma façon de procéder est meilleure, mais ce n'est pas pertinent ici. Henrik, tu as raison; J'ai ajouté un peu à cela à ma réponse.
Charlie
8

EDIT: l'argument d'Andy W m'a convaincu d'abandonner le modèle C. J'ai ajouté une autre possibilité: analyser le changement avec des modèles à coefficients aléatoires (également appelés modèles multiniveaux ou modèles à effets mixtes).

Il y a eu beaucoup de débats scientifiques sur l'utilisation des scores de différence. Mes textes préférés sont Rogosa (1982, [1]) et Fitzmaurice, Laird et Ware (2004, [2]).

En général, vous avez trois possibilités pour analyser vos données:

  • A) Ne prenez que le score de différence interindividuel (le score de changement)
  • B) Traiter la mesure postérieure comme DV et la contrôler pour la ligne de base
  • C) Prendre le score de différence en DV et le contrôler pour la ligne de base (c'est le modèle que vous avez suggéré). En raison des arguments de Andy W, j'ai abandonné cette alternative
  • D) En utilisant une approche de modèle à niveaux multiples / à effets mixtes, dans laquelle la ligne de régression est modélisée pour chaque participant et chaque participant est traité comme des unités de niveau 2.

Les modèles A et B peuvent produire des résultats très différents si la ligne de base est corrélée au score de changement (par exemple, les personnes plus lourdes perdent plus de poids) et / ou que l'attribution du traitement est en corrélation avec la ligne de base.

Si vous voulez en savoir plus sur ces questions, consultez les documents cités, ou ici et ici .

Il existe également une récente étude de simulation [3] qui compare empiriquement les conditions dans lesquelles A ou B sont préférables.

Pour des conceptions complètement équilibrées sans aucune valeur manquante, le modèle D devrait être équivalent au modèle A. Toutefois, il vous donne plus d'informations sur la variabilité entre les personnes, il est facilement étendu à davantage de points de mesure et présente des propriétés intéressantes en présence de données non équilibrées. et / ou des valeurs manquantes.

En bout de ligne: dans votre cas, j'analyserais les mesures postérieures contrôlées pour la ligne de base (modèle B).

[1] Rogosa, D., Brandt, D. et Zimowski, M. (1982). Une approche de la courbe de croissance pour mesurer le changement. Psychological Bulletin, 92, 726-748.

[2] Fitzmaurice, GM, Laird, NM et Ware, JH (2004). Analyse longitudinale appliquée. Hoboken, NJ: Wiley.

[3] Petscher, Y. et Schatschneider, C., 2011. Une étude de simulation sur la performance des scores simples de différence et ajustés à la covariance dans des modèles expérimentaux randomisés. Journal of Educational Measurement, 48, 31-43.

Felix S
la source
J'ai voté contre cette réponse, et vous pouvez voir ma réponse à la question de savoir pourquoi, à mon avis, les scores de changement avec une valeur de référence en tant que covariable ne devraient pas être effectués. En résumé, même si les modèles B et C de votre formulation produisent des effets de traitement équivalents, cela ne signifie pas que le modèle C est préférable. En fait, l’effet de base dans le modèle C est ininterprétable, donc je soutiens qu’il ne devrait pas être utilisé.
Andy W
@AndyW: Votre argument m'a convaincu; bien que l'estimation la plus pertinente de l'effet du traitement soit la même dans les deux modèles, le modèle B doit être préféré au modèle C. J'ai ajusté ma réponse en conséquence. Mais que dites-vous Laird, N. (1983). Further Comparative Analyses of Pretest-Posttest Research Designs. The American Statistician, 37, 329-330.?, Qui montre une équivalence de B et C?
Felix S
b¯b¯
Un point pour le modèle D. Je me demande pourquoi ne pas considérer uniquement le modèle D. C’est le plus cohérent (la valeur de référence est une variable aléatoire et ne doit pas être forcée à une variable dépendante), elle est simple, très flexible (l’interaction peut ajouté) et fournit également l’écart type de la population.
Giordano
3

Glymour et al. (2005) ont utilisé l'ajustement de base lors de l'analyse d'un score de changement. Si le changement de l'état de santé a précédé l'évaluation de base ou s'il existe une erreur de mesure importante dans la variable dépendante, ils constatent qu'un biais peut survenir si le modèle de régression utilisant le score de changement comme variable dépendante inclut une covariable de base. Réponse de Frank Harrell "Le seul problème serait que les erreurs de mesure dans la covariable de base soient confondues avec un autre X, faussant ainsi l'effet de cet autre X". peut refléter le même biais que les adresses Glymour.

Glymour (2005) "Quand un ajustement de base est-il utile dans l'analyse du changement? Un exemple d'éducation et de changement cognitif. American Journal of Epidemiology 162: 267-278

David Svendsgaard
la source
1

Ocram n'est pas correct. La différence de poids ne tient pas compte du poids initial. Plus précisément, le poids initial est enlevé en soustrayant le poids final.

Par conséquent, je dirais que cela ne viole aucune hypothèse si vous contrôlez le poids initial.

(La même logique s'applique si vous prenez la différence entre l'IMC et l'IMC initial.)


Mise à jour
Après la critique d'Andy W, permettez-moi d'être plus formel pour expliquer pourquoi j'ai raison et qu'Ocram a tort (du moins d'après ce que j'ai dit).

aw
iw=awew=aw+Δw

Δw=iwew=awaw+Δw=Δw

aw

Si vous souhaitez en tenir compte, vous devez l'incorporer séparément dans votre modèle (en tant que paramètre ordinaire et / ou en tant que terme d'interaction).

ΔBMJew=awpropΔw

Henrik
la source
Quand j'ai dit que la différence tenait compte du poids initial, c'est ce que je voulais dire en réalité. Maintenant, qu'est-ce que tu écrirais? poids final - poids initial = ...?
ocram
Comme je l'ai écrit, votre argumentation me semble fausse. Je dirais que , en fait , le poids final prend le poids initial plus en compte car il est sur la même « échelle », alors que le diffeence est « redimensionné » (comme le poids final, d' où une certaine absolue valeur est soustraite de anoher absoulte valeur.
Henrik
(-1) Ce n'est pas correct. En général, vous ne devez pas inclure la même variable à droite et à gauche de l'équation (car il en résulte que la variable indépendante est corrélée au terme d'erreur). Donc, si vous utilisez des différences pour la variable dépendante, vous ne devez pas inclure la ligne de base en tant que covariable.
Andy W
@Andy W: Je sais que votre argument est en principe correct. Mais mon argument est que vous divisez en quelque sorte la valeur absolue (en soustrayant la valeur finale de la ligne de base), éliminant ainsi cette corrélation. Par conséquent, l'ajouter en tant que covariable n'introduit pas ce type de corrélation d'erreur erronée.
Henrik le
@Henrik, voyez ma réponse à cette question et pourquoi je continue de croire que ce sentiment est erroné.
Andy W
0

Observe ceci

end weightinitial weightY=β0+βTx

est équivalent à

end weight=initial weight+β0+βTx

En mots, utiliser le changement de poids (au lieu du poids final lui-même) en tant que DV représente déjà le poids initial.

ocram
la source
1
Mais je suppose qu’il pourrait y avoir une interaction entre le poids initial et la perte de poids donnée lors de l’entraînement. Supposons qu'un adulte d'une taille de 1,90 m et d'une masse corporelle de 70 kg et qu'un adulte d'une taille de 1,60 m et d'une masse corporelle de 90 kg participent aux mêmes exercices d'entraînement. Je parierais que ce dernier perd plus de poids. Après réflexion, l’indice de masse corporelle est peut-être un meilleur CV que le simple poids.
xmjx
1
@xmjx: Si vous pensez que le poids initial aura un impact sur le poids final - et vous avez probablement raison - c'est une bonne idée de l'introduire en tant que compensation dans le modèle, comme cela se fait ici ...
ocram
3
Pas correct en général. Si la pente du poids de base n'est pas égale à 1,0, l'analyse du changement ne sera pas équivalente à l'analyse du poids final, à moins que le poids initial ne figure dans les deux modèles et que vous utilisiez une régression ordinaire. Si le poids de base est à deux endroits, le modèle est en réalité plus difficile à expliquer. Par conséquent, les raisons de la persistance de cette approche ne sont pas claires.
Frank Harrell