C'est une affirmation habituelle sur la famille exponentielle, mais à mon avis, la plupart du temps, elle est énoncée d'une manière qui peut dérouter le lecteur moins expérimenté. Parce que, pris à leur valeur nominale, il pourrait être interprété comme disant "si notre variable aléatoire suit une distribution dans la famille exponentielle, alors si nous prenons un échantillon et l'insérons dans la statistique suffisante, nous obtiendrons la vraie valeur attendue de la statistique ". Si seulement il en était ainsi ... De plus, il ne prend pas en compte la taille de l'échantillon, ce qui peut créer encore plus de confusion.
La fonction de densité exponentielle est
fX(x)=h(x)eη(θ)T(x)e−A(θ)(1)
où est la statistique suffisante.T(x)
Puisque c'est une densité, elle doit s'intégrer à l'unité, donc ( est le support de ) XSxX
∫Sxh(x)eη(θ)T(x)e−A(θ)dx=1(2)
Eq. est valable pour tous les afin que nous puissions différencier les deux côtés par rapport à lui:θ(2)θ
∂∂θ∫Sxh(x)eη(θ)T(x)e−A(θ)dx=∂(1)∂θ=0(3)
En échangeant l'ordre de différenciation et d'intégration, on obtient
∫Sx∂∂θ(h(x)eη(θ)T(x)e−A(θ))dx=0(4)
Effectuer la différenciation que nous avons
∂∂θ(h(x)eη(θ)T(x)e−A(θ))=fX(x)[T(x)η′(θ)−A′(θ)](5)
En insérant dans on obtient(5)(4)
∫SxfX(x)[T(x)η′(θ)−A′(θ)]dx=0
⇒η′(θ)E[T(X)]−A′(θ)=0⇒E[T(X)]=A′(θ)η′(θ)(6)
Maintenant, nous demandons: le côté gauche de est un nombre réel. Ainsi, le côté droit doit également être un nombre réel et non une fonction . Par conséquent, il doit être évalué à un spécifique , et ce devrait être le "vrai" , sinon dans le côté gauche, nous n'aurions pas la vraie valeur attendue de . Pour souligner cela, nous notons la vraie valeur par , et nous réécrivons comme(6)θθT(X)θ0(6)
Eθ0[T(X)]=A′(θ)η′(θ)∣∣θ=θ0(6a)
Nous passons maintenant à l' estimation du maximum de vraisemblance . La log-vraisemblance pour un échantillon de taille estn
L(θ∣x)=∑i=1nlnh(xi)+η(θ)∑i=1nT(xi)−nA(θ)
En fixant sa dérivée par rapport à égale à nous obtenons le MLEθ0
θ^(x):1n∑i=1nT(xi)=A′(θ)η′(θ)∣∣θ=θ^(x)(7)
Comparez avec . Les côtés droits ne sont pas égaux, car nous ne pouvons pas affirmer que l'estimateur MLE a atteint la vraie valeur. Il en va de même pour la gauche. Mais rappelez-vous que l'éq. vaut pour tous les et donc pour également. Ainsi, les étapes de l'éq. peut être pris par rapport à et nous pouvons donc écrire eq. pour :( 6 a ) 2 θ θ 3 , 4 , 5 , 6 θ 6 a θ(7)(6a)2 θθ^3,4,5,6θ^6aθ^
Eθ^(x)[T(X)]=A′(θ)η′(θ)∣∣θ=θ^(x)(6b)
ce qui, combiné avec , nous conduit à la relation valide(7)
Eθ^(x)[T(X)]=1n∑i=1nT(xi)
c'est ce que dit réellement l'assertion à l'examen: la valeur attendue de la statistique suffisante sous le MLE pour les paramètres inconnus (en d'autres termes, la valeur du premier moment brut de la distribution que nous obtiendrons si nous utilisons à la place de ), est égal (et il n'est pas simplement approximé par) la moyenne de la statistique suffisante calculée à partir de l'échantillon . θ^(x)θx
De plus, seulement si la taille de l'échantillon est alors nous pourrions dire avec précision que "la valeur attendue de la statistique suffisante sous le MLE est égale à la statistique suffisante".n=1