Quelle est la justification de l'utilisation d'approximations taylor dans les opérateurs d'espérance?

8

Je vois parfois des gens utiliser l'approximation de Taylor comme suit:

E(ex)E(1+x)

Je sais que l'approximation taylor fonctionne pour

ex1+x

Mais il n'est pas clair pour moi que nous pouvons faire l'approximation à l'intérieur de l'opérateur d'attente. Intuitivement, je suppose que cela fonctionne si "la probabilité que soit beaucoup plus grand que 0 soit petite", mais je ne sais pas à quel point c'est rigoureux.x

Edit : je suis encore plus confus quand on a une attente d'une fonction:

E(f(ex))?E(f(1+x))
user56834
la source
1
@repmat, ce n'est pas vrai du tout. la linéarité n'implique pas la commutativité entre les opérateurs de fonction et d'attente
user56834

Réponses:

6

Pour votre exemple spécifique, l'approximation de Taylor de premier ordre autour de , doncx0=0,ex=e0+e0x+R1=1+x+R1

E(ex)=E(1+x)+E(R1)

La question est donc "que pouvons-nous dire à propos de ? Eh bien, nous ne savons pas autant que nous le souhaiterions sur l'approximation de Taylor - la signification, sur le comportement du reste. E(R1)

Voir cet exemple de pourquoi le reste est une chose perfide, mais aussi, je suggère de lire le fil très stimulant, Prendre les attentes de la série Taylor (en particulier le reste) sur la question.

Un résultat intéressant en régression linéaire est le suivant: supposons que nous avons le vrai modèle non linéaire

yi=m(xi)+ei

où est la fonction d'attente conditionnelle, , et donc par construction .m(xi)E(yixi)=m(xi)E(eixi)=0

Considérons l'approximation de Taylor de premier ordre spécifiquement autour deE(xi)

yi=β0+xiβ+ui,ui=R1i+ei

où est le reste de Taylor de l'approximation, les bêtas sont les dérivées partielles de la fonction non linéaire par rapport aux évalués à , tandis que le terme constant recueille tous les autres les choses fixes de l'approximation (à propos, c'est la raison pour laquelle a) on nous dit "toujours inclure une constante dans la spécification" mais que b) la constante est au-delà de l'interprétation significative dans la plupart des cas).R1ixiE(xi)

Ensuite, si nous appliquons l'estimation des moindres carrés ordinaires, nous obtenons que le reste de Taylor ne sera pas corrigé pour les régresseurs, , et aussi . Le premier résultat implique que les propriétés de l'estimateur OLS pour les bêtas ne sont pas affectées par le fait que nous avons approximé la fonction non linéaire par son approximation de Taylor de premier ordre. Le deuxième résultat implique que l'approximation est optimale sous le même critère pour lequel l'espérance conditionnelle est le prédicteur optimal (erreur quadratique moyenne, ici reste quadratique moyenne). E(R1ixi)=E(R1i)E(xi)E(R1i2)=min

Les deux prémisses sont nécessaires pour ces résultats, à savoir que nous prenons l'expansion de Taylor autour de la valeur attendue des régresseurs et que nous utilisons OLS.

Alecos Papadopoulos
la source
2

Une situation dans laquelle cela est utilisé est l'asymptotique.

Par exemple, supposons que et est une fonction lisse. Alors où signifie convergence dans la distribution (également appelée convergence dans la loi). En effet, nous supprimons les termes d'ordre supérieur dans l'expansion et le traiter comme On écrit Xnμσ/nN(0,1)g

g(Xn)g(μ)|g(μ)|σ/nLN(0,1) as n,
L''
g(x)=g(μ)+g(μ)(xμ)+g(μ)2(xμ)2+g(μ)6(xμ)3+
g(x)g(μ)+g(μ)(xμ).
g(Xn)AN(g(μ),g(μ)2σ2n)
AN'' signifie" asymptotiquement normal ".
Michael Hardy
la source
1
Je ne pense pas que cela réponde à la question. Vous rapportez simplement un exemple dans lequel cette approximation est effectuée, sans expliquer pourquoi elle est légitime.
Federico Poloni