Je souhaite mieux comprendre la méthode delta pour l'approximation des erreurs-types des effets marginaux moyens d'un modèle de régression qui inclut un terme d'interaction. J'ai examiné des questions connexes sous la méthode delta, mais aucune n'a fourni exactement ce que je cherchais.
Considérez les données d'exemple suivantes comme un exemple de motivation:
set.seed(1)
x1 <- rnorm(100)
x2 <- rbinom(100,1,.5)
y <- x1 + x2 + x1*x2 + rnorm(100)
m <- lm(y ~ x1*x2)
Je m'intéresse aux effets marginaux moyens (TEA) de x1
et x2
. Pour les calculer, je fais simplement ce qui suit:
cf <- summary(m)$coef
me_x1 <- cf['x1',1] + cf['x1:x2',1]*x2 # MEs of x1 given x2
me_x2 <- cf['x2',1] + cf['x1:x2',1]*x1 # MEs of x2 given x1
mean(me_x1) # AME of x1
mean(me_x2) # AME of x2
Mais comment utiliser la méthode delta pour calculer les erreurs standard de ces AME?
Je peux calculer la SE pour cette interaction particulière à la main:
v <- vcov(m)
sqrt(v['x1','x1'] + (mean(x2)^2)*v['x1:x2','x1:x2'] + 2*mean(x2)*v['x1','x1:x2'])
Mais je ne comprends pas comment utiliser la méthode delta.
Idéalement, je cherche des conseils sur la façon de penser (et de coder) la méthode delta pour les AME de tout modèle de régression arbitraire. Par exemple, cette question fournit une formule pour le SE pour un effet d'interaction particulier et ce document de Matt Golder fournit des formules pour une variété de modèles interactifs, mais je veux mieux comprendre la procédure générale pour calculer les SE des AME plutôt que la formule pour le SE d'un TEA particulier.
Réponses:
La méthode delta dit simplement que si vous pouvez représenter une variable auxiliaire, vous pouvez représenter en fonction de variables aléatoires normalement distribuées, cette variable auxiliaire est approximativement normalement distribuée avec une variance correspondant à la variation de l'auxiliaire par rapport aux variables normales (EDIT: comme l'a souligné Alecos Papadopoulos, la méthode delta peut être énoncée de manière plus générale de sorte qu'elle ne nécessite pas de normalité asymptotique). La façon la plus simple d'envisager cela est une expansion de Taylor, où le premier terme d'une fonction est la moyenne, et la variance vient des termes du second ordre. Plus précisément, si est une fonction du paramètre β et b est un estimateur cohérent et normalement distribué pour ce paramètre: g (g β b
Puisque β est une constante, et b est un estimateur cohérent pour β , on peut alors dire:
√
R
numDeriv
ADDENDA: Dans ce cas spécifique, le
R
code serait:la source
mean(x2)
lors du calcul de la SE. Ne serait-ce pas uniquement pour l'effet marginal à la moyenne? Mon intuition serait que pour les TEA, je devrais effectuer une SE pour chaque observation, puis faire une moyenne entre eux d'une manière ou d'une autre.g
comme la moyenne des effets marginaux pour chaque individu, et probablement utiliser le gradient numérique, je ne suis pas sûr que prendre la SE pour chacun serait tout à fait la même chose.