Pour quelle distribution une moyenne ajustée est-elle l'estimateur du maximum de vraisemblance?

8

La moyenne de l'échantillon est l'estimateur du maximum de vraisemblance de pour une distribution normale . La médiane de l'échantillon est l'estimateur du maximum de vraisemblance de pour une distribution de Laplace (également appelée distribution exponentielle double).μNormal(μ,σ)m Laplace(m,s)

Existe-t-il une distribution avec un paramètre d'emplacement pour lequel la moyenne de l'échantillon ajusté est l'estimateur du maximum de vraisemblance?

Rasmus Bååth
la source

Réponses:

9

Les distributions, le cas échéant, sont obtenues sous forme d'intégrales des équations d'estimation. Supposons par souci de simplicité que le paramètre d'échelle soit connu et que les paramètres d'ajustement, le cas échéant, soient fixes.

  1. Pour la moyenne de l'échantillon, l'équation d'estimation estEn imaginant que c'est le dérivé de la log-vraisemblance, avec beaucoup d'abus de notation et de perte de rigueur, nous avons où l' paramètre (constante d'intégration) doit être négatif pour qu'il intègre à quelque chose de significatif.
    E(xμ)=0.
    dlnl(μ;x)dμ=xμ,lnl(μ;x)=a(xμ)2,l(μ;x)exp[a(xμ)2],
    a
  2. Pour la médiane de l'échantillon, l'équation d'estimation estIntégrez ceci pour obtenir où encore une fois nous devions choisir pour être négatif pour donner un sens.
    Esign(xμ)=0.
    l(μ;x)exp[a|xμ|],
    a
  3. Pour la moyenne ajustée, l'équation d'estimation estVoyons ce qu'il intègre:On dirait une normale censurée au centre, mais regardez les queues: elles sont incorrectes si . Donc, pour obtenir une distribution correcte, nous devons définir . Mais alors nous avons une incohérence logique: cette distribution devrait donner un pdf nul à certaines données réelles dans les queues coupées. Ceci est contradictoire et montre certains effets secondaires indésirables de la coupe.
    Eρ(x,μ,c)=0,ρ(x,μ,c)={xμ,|xμ|c,0,|xμ|>c.
    l(μ;x,c)={exp[a(xμ)2],|xμ|c,b,|xμ|>c.
    b>0b=0

Parfois, il est avantageux d'établir la «vraisemblance» d'une méthode pour montrer sa normalité asymptotique et son efficacité pour une classe étroite de distributions. En général, la normalité asymptotique de la moyenne ajustée peut découler de la théorie des estimationsM

StasK
la source
1
Est-ce vraiment l'équation d'estimation d'une moyenne ajustée? Dans votre équation, semble être une constante qui «rejette» les données qui sont éloignées de la moyenne tandis que dans la version habituelle d'une moyenne tronquée, vous définissez la proportion des points de données à éliminer des queues des données. Ces deux choses ne sont-elles pas différentes ou manque-t-il quelque chose? cc
Rasmus Bååth
Oui, c'est quelque peu différent en effet - j'ai dit que je traitais la constante de coupe comme fixe. Le rendre dépendant des données compliquera les choses, mais je pense que cela conduirait éventuellement à la conclusion similaire que certains points de données sont "impossibles" selon la distribution impliquée par la "probabilité".
StasK
4

Mis à part des cas spéciaux comme la médiane, je ne pense pas que les moyennes ajustées soient généralement ML; s'ils l'étaient, ils seraient déjà une forme d'estimateur M. Cependant, si vous prenez une distribution qui est normale au milieu avec, par exemple, des queues exponentielles - la distribution correspondant à un estimateur M de Huber - alors pour un niveau particulier de rognage, la moyenne rognée devrait être très efficace.

Glen_b -Reinstate Monica
la source