Quels sont les inconvénients de la probabilité de profil?

19

Considérons un vecteur de paramètres , avec θ 1 le paramètre d'intérêt et θ 2 un paramètre de nuisance.(θ1,θ2)θ1θ2

Si est la probabilité construite à partir des données x , la probabilité de profil pour θ 1 est définie comme L P ( θ 1 ; x ) = L ( θ 1 , θ 2 ( θ 1 ) ; x )θ 2 ( θ 1 ) est le MLE de θ 2L(θ1,θ2;x)xθ1LP(θ1;X)=L(θ1,θ^2(θ1);X)θ^2(θ1)θ2pour une valeur fixe de .θ1

maximisant la vraisemblance de profil par rapport à & thetav 1 conduit àmême estimation thetav 1 que celui obtenu en maximisant simultanément la probabilité par rapport à thetav 1 et & thetav 2 .θ1θ^1θ1θ2

Je pense que l'écarttype de θ 1 peut également être estiméepartirla dérivée seconde de la probabilité de profil.θ^1

La statistique de vraisemblance pour H 0 : θ 1 = θ 0 peut être écrit en fonction de la probabilitéprofil: L R = 2 log ( L P ( θ 1 ; x )H0:θ1=θ0.LR=2Journal(LP(θ^1;X)LP(θ0;X))

Il semble donc que la vraisemblance du profil puisse être utilisée exactement comme s'il s'agissait d'une vraisemblance réelle. Est-ce vraiment le cas? Quels sont les principaux inconvénients de cette approche? Et qu'en est-il de la «rumeur» selon laquelle l'estimateur obtenu à partir de la probabilité de profil est biaisé (éditer: même asymptotiquement)?

ocram
la source
2
juste une note, les estimateurs de la vraisemblance peuvent également être biaisés, l'exemple classique est l'estimation de la variance de vraisemblance pour un échantillon normal.
mpiktas
@mpiktas: Merci pour votre commentaire. En effet, le mle classique peut également être biaisé. Je vais modifier la question pour clarifier les choses.
ocram
quel est le biais asymptotique? Parlez-vous d'estimateurs non cohérents?
mpiktas
@mpiktas: Oui, c'est ce que j'aurais dû dire ...
ocram

Réponses:

14

L'estimation de partir de la vraisemblance du profil n'est que le MLE. La maximisation par rapport à θ 2 pour chaque θ 1 possible , puis la maximisation par rapport à θ 1 est la même chose que la maximisation par rapport à ( θ 1 , θ 2 ) conjointement.θ1θ2θ1θ1(θ1,θ2)

La principale faiblesse est que, si vous basez votre estimation de la SE de θ 1 sur la courbure de la probabilité de profil, vous n'êtes pas entièrement la comptabilité pour l'incertitude θ 2 .θ^1θ2

McCullagh et Nelder, Modèles linéaires généralisés, 2e édition , a une courte section sur la vraisemblance du profil (Sec 7.2.4, pages 254-255). Ils disent:

[A] des ensembles de confiance approximatifs peuvent être obtenus de la manière habituelle .... de tels intervalles de confiance sont souvent satisfaisants si [la dimension de ] est petite par rapport à l'information totale de Fisher, mais sont susceptibles d'induire en erreur autrement. .. Malheureusement [la vraisemblance du journal de profil] n'est pas une fonction de vraisemblance du journal au sens habituel. De toute évidence, sa dérivée n'a pas de moyenne nulle, une propriété qui est essentielle pour estimer les équations.θ2

Karl
la source
ElP(θ1)θ10
Question intéressante, même si elle nécessitait un voyage à la bibliothèque (ce que j'aurais dû faire de toute façon). J'ai ajouté un peu à ma réponse sur ce point.
Karl
Merci beaucoup pour la retouche. On dit que la propriété (le score évalué à la vraie valeur du paramètre a une moyenne nulle) est essentielle pour estimer les équations. Mais bien que la probabilité du journal de profil ne remplisse pas cette propriété, elle produit le MLE. Y a-t-il quelque chose qui me manque?
ocram
Cette propriété n'est pas nécessaire pour fournir le MLE.
Karl