Quelles distributions ont des solutions de forme fermée pour l'estimation du maximum de vraisemblance?

21

Quelles distributions ont des solutions sous forme fermée pour les estimations du maximum de vraisemblance des paramètres à partir d'un échantillon d'observations indépendantes?

Colonel Panic
la source

Réponses:

25

Sans perte de généralité appréciable, nous pouvons supposer que la densité de probabilité (ou masse) pour toute observation (sur observations) est strictement positive, ce qui nous permet de l'écrire comme exponentiellex i nf(xi)xin

f(xi)=exp(g(xi,θ))

pour un vecteur de paramètre .θ=(θj)

L'égalisation du gradient de la fonction log de vraisemblance à zéro (qui trouve les points stationnaires de la vraisemblance, parmi lesquels seront tous les maxima globaux intérieurs s'il en existe un) donne un ensemble d'équations de la forme

idg(xi,θ)dθj=0,

un pour chaque . Pour l'un de ces d'avoir une solution prête, nous voudrions pouvoir séparer les termes de la termes . (Tout découle de cette idée clé, motivée par le principe de la paresse mathématique : faites le moins de travail possible; réfléchissez avant de calculer; abordez d'abord les versions faciles des problèmes difficiles.) La façon la plus générale de le faire est de prendre les équations la formex i θjxiθ

i(ηj(θ)τj(xi)αj(θ))=ηj(θ)iτj(xi)nαj(θ)

pour les fonctions connues , et , car alors la solution est obtenue en résolvant les équations simultanéesτ j α jηjτjαj

nαj(θ)ηj(θ)=iτj(xi)

pour . En général, ceux-ci seront difficiles à résoudre, mais à condition que l'ensemble des valeurs de donne des informations complètes sur , nous pourrions utilisez simplement ce vecteur à la place de lui-même (généralisant ainsi quelque peu l'idée d'une solution de "forme fermée", mais d'une manière très productive). Dans un tel cas, l'intégration en ce qui rendements( n α j ( θ )θθθθj(nαj(θ)ηj(θ))θ θθj

g(x,θ)=τj(x)θηj(θ)dθjθαj(θ)dθj+B(x,θj)

(où représente tous les composants de sauf ). Parce que le côté gauche est fonctionnellement indépendant de , nous devons avoir cela pour une fonction fixe ; que ne doit pas du tout dépendre de ; et les sont des dérivés d'une fonction et les sont des dérivés d'une autre fonction , tous deux fonctionnellement indépendants des données. D'où θ θ j θ j τ j ( x ) = T ( x ) T B θ η j H ( θ ) α j A ( θ )θjθθjθjτj(x)=T(x)TBθηjH(θ)αjA(θ)

g(x,θ)=H(θ)T(x)A(θ)+B(x).

Les densités qui peuvent être écrites sous cette forme constituent la fameuse famille Koopman-Pitman-Darmois , ou exponentielle . Il comprend d'importantes familles paramétriques, à la fois continues et discrètes, y compris Gamma, Normal, Chi-carré, Poisson, Multinomial et bien d'autres .

whuber
la source
Et pour ceux qui n'ont pas de formulaires fermés, nous pourrions utiliser l'algorithme EM. Par exemple, considérons le poisson moddel gonflé à zéro: stats.stackexchange.com/questions/32133/…
Damien
0

Je ne sais pas si je pourrais tous les énumérer. Les exponentielles, normales et binomiales viennent à l'esprit et elles entrent toutes dans la classe des familles exponentielles. La famille exponentielle a sa statistique suffisante dans l'exposant et le mle est souvent une belle fonction de cette statistique suffisante.

Michael R. Chernick
la source
8
Cette question est incroyablement large, mais il semble que le PO demande peut-être ce qui caractérise une distribution qui a une solution de forme fermée pour le MLE plutôt que de demander une liste exhaustive. En tout cas, une liste exhaustive n'est même pas possible.
Macro
2
[logxlog(1x)]Tab
Thnaks Neil pour l'avoir signalé. Je suppose que toutes les distributions de familles exponentielles n'ont pas de solutions sous forme fermée.
Michael R. Chernick