Quels sont les estimateurs du maximum de vraisemblance pour les paramètres de la distribution t de Student? Existent-ils sous forme fermée? Une recherche rapide sur Google ne m'a donné aucun résultat.
Aujourd'hui, je m'intéresse au cas univarié, mais je devrai probablement étendre le modèle à plusieurs dimensions.
EDIT: Je suis en fait principalement intéressé par les paramètres de localisation et d'échelle. Pour l'instant, je peux supposer que le paramètre des degrés de liberté est fixe, et éventuellement utiliser un schéma numérique pour trouver la valeur optimale plus tard.
Réponses:
La forme fermée n'existe pas pour T, mais une approche très intuitive et stable se fait via l'algorithme EM. Maintenant que l'élève est un mélange d'échelle de normales, vous pouvez écrire votre modèle comme
où et w i ∼ G a ( νei|σ,wi∼N(0,σ2w−1i) . Cela signifie que conditionnellement surwile mle ne sont que la moyenne pondérée et l'écart type. Ceci est l'étape "M"wi∼Ga(ν2,ν2) wi
σ 2=Σiwi(yi - μ )2
Maintenant, l'étape "E" remplace par son attente compte tenu de toutes les données. Ceci est donné comme:wi
il vous suffit donc d'itérer les deux étapes ci-dessus, en remplaçant le "côté droit" de chaque équation par les estimations des paramètres actuels.
Cela montre très facilement les propriétés de robustesse de la distribution t car les observations avec de grands résidus reçoivent moins de poids dans le calcul pour l'emplacement , et une influence limitée dans le calcul de σ 2 . Par "influence bornée", je veux dire que la contribution à l'estimation pour σ 2 de la ième observation ne peut pas dépasser un seuil donné (c'est ( ν + 1 ) σ 2 o l d dans l'algorithme EM). De plus, ν est un paramètre de «robustesse» en ce que l'augmentation (la diminution) de ν entraînera plus (moins) de poids uniformes et donc plus (moins) de sensibilité aux valeurs aberrantes.μ σ2 σ2 (ν+1)σ2old ν ν
Une chose à noter est que la fonction de vraisemblance logarithmique peut avoir plus d'un point stationnaire, donc l'algorithme EM peut converger vers un mode local au lieu d'un mode global. Les modes locaux sont susceptibles d'être trouvés lorsque le paramètre d'emplacement est démarré trop près d'une valeur aberrante. Donc, commencer par la médiane est un bon moyen d'éviter cela.
la source
Le document suivant traite exactement du problème que vous avez signalé.
Liu C. et Rubin DB 1995. "Estimation ML de la distribution t en utilisant EM et ses extensions, ECM et ECME." Statistica Sinica 5: 19–39.
Il fournit une estimation générale des paramètres de distribution t multivariée, avec ou sans connaissance du degré de liberté. La procédure peut être trouvée dans la section 4, et elle est très similaire aux probabilités logiques pour 1 dimension.
la source
la source
J'ai récemment découvert un estimateur de forme fermée pour l'échelle de la distribution t de Student. À ma connaissance, il s'agit d'une nouvelle contribution, mais je serais heureux de recevoir des commentaires suggérant des résultats connexes. L'article décrit la méthode dans le contexte d'une famille de distributions «exponentielles couplées». Le t de Student est appelé gaussien couplé, où le terme de couplage est l'inverse du degré de liberté. La statistique de forme fermée est la moyenne géométrique des échantillons. En supposant une valeur du couplage ou degré de liberté, une estimation de l'échelle est déterminée en multipliant la moyenne géométrique des échantillons par une fonction impliquant le couplage et un nombre harmonique.
https://arxiv.org/abs/1804.03989 Utilisation de la moyenne géométrique comme statistique pour l'échelle des distributions gaussiennes couplées, Kenric P. Nelson, Mark A. Kon, Sabir R. Umarov
la source