Quelle est la différence entre un facteur MIMIC et un composite avec indicateurs (SEM)?

10

Dans la modélisation d'équations structurelles avec des variables latentes (SEM), une formulation de modèle courante est «indicateur multiple, cause multiple» (MIMIC) où une variable latente est causée par certaines variables et reflétée par d'autres. Voici un exemple simple: entrez la description de l'image ici

Essentiellement, f1est un résultat de régression pour x1, x2et x3, et y1, y2et y3sont des indicateurs de mesure pour f1.

On peut également définir une variable latente composite, où la variable latente équivaut essentiellement à une combinaison pondérée de ses variables constituantes.

Voici ma question: existe-t-il une différence entre la définition f1d'un résultat de régression et la définition d'un résultat composite dans un modèle MIMIC?

Certains tests utilisant un lavaanlogiciel Rmontrent que les coefficients sont identiques:

library(lavaan)

# load/prep data
data <- read.table("http://www.statmodel.com/usersguide/chap5/ex5.8.dat")
names(data) <- c(paste("y", 1:6, sep=""), paste("x", 1:3, sep=""))

# model 1 - canonical mimic model (using the '~' regression operator)
model1 <- '
    f1 =~ y1 + y2 + y3
    f1 ~ x1 + x2 + x3
'

# model 2 - seemingly the same (using the '<~' composite operator)
model2 <- '
    f1 =~ y1 + y2 + y3
    f1 <~ x1 + x2 + x3
'

# run lavaan
fit1 <- sem(model1, data=data, std.lv=TRUE)
fit2 <- sem(model2, data=data, std.lv=TRUE)

# test equality - only the operators are different
all.equal(parameterEstimates(fit1), parameterEstimates(fit2))
[1] "Component “op”: 3 string mismatches"

Comment ces deux modèles sont-ils mathématiquement identiques? Ma compréhension est que les formules de régression dans un SEM sont fondamentalement différentes des formules composites, mais cette conclusion semble rejeter cette idée. De plus, il est facile de trouver un modèle où l' ~opérateur n'est pas interchangeable avec l' <~opérateur (pour utiliser lavaanla syntaxe de). Habituellement, l'utilisation de l'un à la place de l'autre entraîne un problème d'identification du modèle, en particulier lorsque la variable latente est ensuite utilisée dans une formule de régression différente. Alors, quand sont-ils interchangeables et quand ne le sont-ils pas?

Le manuel de Rex Kline (Principes et pratique de la modélisation d'équations structurelles) a tendance à parler des modèles MIMIC avec la terminologie des composites, mais Yves Rosseel, l'auteur de lavaan, utilise explicitement l'opérateur de régression dans chaque exemple MIMIC que j'ai vu.

Quelqu'un peut-il clarifier cette question?

dmp
la source

Réponses:

9

C'est le même modèle.

Il est utile de pouvoir définir une variable latente comme un résultat composite où cette variable n'a que des indicateurs composites.

Si vous n'avez pas:

f1 =~ y1 + y2 + y3

Vous ne pouvez pas mettre:

f1 ~ x1 + x2 + x3

Mais vous pouvez avoir:

f1 <~ x1 + x2 + x3
Jeremy Miles
la source
Merci! Pourriez-vous peut-être préciser pourquoi vous ne pouvez pas avoir f1 ~ x1 + x2 + x3, mais vous pouvez avoir f1 <~ x1 + x2 + x3?
dmp
1
Parce que dans le premier cas, f1 n'est pas encore une variable dans le modèle, car il est latent, vous devez le définir.
Jeremy Miles
1
Si vous aviez un tel modèle, vous deviez utiliser une astuce comme f1 = ~ 0 * x1 pour avoir une var latente, que vous pourrez ensuite utiliser dans f ~ x1 + x2 + x3.
Jeremy Miles