Cette question est motivée par celle-ci . J'ai recherché deux sources et c'est ce que j'ai trouvé.
A. van der Vaart, Statistiques asymptotiques:
Il est rarement possible de calculer explicitement une vraisemblance de profil, mais son évaluation numérique est souvent réalisable. Ensuite, la vraisemblance du profil peut servir à réduire la dimension de la fonction de vraisemblance. Les fonctions de vraisemblance de profil sont souvent utilisées de la même manière que les fonctions de vraisemblance (ordinaires) des modèles paramétriques. En dehors de prendre leurs points de maximale estimateurs & thetav , la dérivée seconde à θ est utilisée comme une estimation du moins l'inverse de la matrice de covariance asymptotique de e. Des recherches récentes semblent valider cette pratique.
J. Wooldridge, Analyse économétrique des données des sections et des panels (les mêmes dans les deux éditions):
Wooldridge discute du problème dans un contexte plus large des estimateurs M, il s'applique donc également aux estimateurs du maximum de vraisemblance.
Nous obtenons donc deux réponses différentes pour la même question. Le diable à mon avis est dans les détails. Pour certains modèles, nous pouvons utiliser la toile de jute de vraisemblance de profil en toute sécurité pour certains modèles non. Y a-t-il des résultats généraux qui donnent des conditions quand pouvons-nous le faire (ou pas)?
Réponses:
Malheureusement, cela est vrai pour l'instant et peu susceptible de changer.
La discussion la plus claire que je connaisse est Les règles de l'inférence conditionnelle: Existe-t-il une définition universelle de la nonformation? B Jørgensen - Méthodes statistiques et applications, 1994.
Et pour certains des problèmes spécifiques à la résolution des échecs de ressemblance de profils Stafford, JE (1996). Un ajustement robuste de la vraisemblance du profil, Annals of Statistics, 24, 336-52.
la source
Une réponse rapide: Ceci est discuté dans le chapitre trois de OE Barndorff-Nielsen & DR Cox: Inférence et asymptotique, Chapman & Hall, page 90, équation 3.31, qu'ils attribuent à Patefield. Ils concluent que pour un paramètre scalaire, cela est valide (ils n'analysent pas d'autres cas).
la source