J'ai entendu parler de la probabilité empirique d'Owen, mais jusqu'à récemment, je n'y ai pas prêté attention avant de l'avoir trouvé dans un document d'intérêt ( Mengersen et al. 2012 ).
Dans mes efforts pour le comprendre, j'ai glané que la probabilité des données observées est représentée comme , où et .
Cependant, je n'ai pas pu faire le saut mental reliant cette représentation à la façon dont elle peut être utilisée pour faire des inférences sur les observations. Peut-être suis-je trop enraciné dans la pensée d'une vraisemblance par rapport aux paramètres d'un modèle?
Quoi qu'il en soit, j'ai recherché dans Google Scholar des articles utilisant des probabilités empiriques qui m'aideraient à internaliser le concept ... en vain. De toute évidence, il y a le livre d'Art Owen sur la probabilité empirique , mais Google Books laisse de côté tous les bons morceaux et je suis toujours en train d'obtenir un prêt entre bibliothèques.
En attendant, quelqu'un peut-il me montrer des articles et des documents qui illustrent clairement la prémisse de la probabilité empirique et comment elle est utilisée? Une description illustrative de EL elle-même serait également la bienvenue!
Réponses:
Je ne vois pas de meilleur endroit que le livre d'Owen pour en savoir plus sur la probabilité empirique.
Une façon pratique de penser à est la probabilité d'une distribution multinomiale sur les points de données observés . La vraisemblance est donc fonction du vecteur de probabilité , l'espace des paramètres est en réalité le simplexe à dimensions des vecteurs de probabilité, et le MLE met le poids sur chacune des observations (en supposant qu'elles sont tous différents). La dimension de l'espace des paramètres augmente avec le nombre d'observations.x 1 , … , x n ( p 1 , … , p n ) n 1 / nL=L(p1,…,pn) x1,…,xn (p1,…,pn) n 1/n
Un point central est que la vraisemblance empirique donne une méthode de calcul des intervalles de confiance par profilage sans spécifier de modèle paramétrique. Si le paramètre d'intérêt est la moyenne, , alors pour tout vecteur de probabilité nous avons que la moyenne est et nous pouvons calculer la vraisemblance du profil comme Ensuite, nous pouvons calculer les intervalles de confiance de la forme avec . Ici est la moyenne empirique etμ p=(p1,…,pn)
Le livre d'Owen couvre cela en détail et fournit des extensions à des problèmes statistiques plus compliqués et à d'autres paramètres d'intérêt.
la source
En économétrie, de nombreux articles appliqués partent de l'hypothèse que où est un vecteur de données, est un système connu d' équations et est un paramètre inconnu, . La fonction provient d'un modèle économique. Le but est d'estimer .
L'approche traditionnelle, en économétrie, pour l'estimation et l'inférence sur est d'utiliser la méthode généralisée des moments: où est une matrice de pondération définie positive et La vraisemblance empirique fournit un estimateur alternatif au GMM. L'idée est d'appliquer la condition de moment comme contrainte lors de la maximisation de la vraisemblance non paramétrique. Tout d'abord, corrigez un . ensuite sous réserve deθ
Il y a bien sûr de nombreuses autres raisons pour lesquelles EL a retenu l'attention en économétrie, mais j'espère que c'est un point de départ utile. Les modèles d'égalité des moments sont très courants en économie empirique.
la source
En analyse de survie, la courbe de Kaplan-Meier est l'estimateur non paramétrique le plus célèbre de la fonction de survie , où désigne la variable aléatoire de temps à événement. Fondamentalement, est une généralisation de la fonction de distribution empirique qui permet la censure. Il peut être dérivé heuristiquement, comme indiqué dans la plupart des manuels pratiques. Mais il peut également être formellement dérivé en tant qu'estimateur de vraisemblance maximale (empirique). Voici plus de détails .S(t)=Pr(T>t) T S^
la source