Fondamentalement, je me demande comment les différentes structures de covariance sont appliquées et comment les valeurs à l'intérieur de ces matrices sont calculées. Des fonctions comme lme () nous permettent de choisir quelle structure nous aimerions, mais j'aimerais savoir comment elles sont estimées.
Considérons le modèle à effets mixtes linéaires .
Où et . En outre:ϵ d ∼ N ( 0 , R )
Pour simplifier, nous supposerons .
Fondamentalement, ma question est: comment exactement est-il estimé à partir des données pour les différentes paramétrisations? Dites si nous supposons que est diagonal (les effets aléatoires sont indépendants) ou entièrement paramétré (cas qui m'intéresse plus pour le moment) ou l'une des diverses autres paramétrisations? Existe-t-il des estimateurs / équations simples pour ceux-ci? (Cela serait sans doute estimé itérativement.)D D
EDIT: Du livre Variance Components (Searle, Casella, McCulloch 2006), j'ai réussi à briller ce qui suit:
Si alors les composantes de la variance sont mises à jour et calculées comme suit:
Où β ( k ) et u ( k ) sont les k ème jour respectivement.
Existe-t-il des formules générales lorsque est en diagonale de bloc ou entièrement paramétré? Je suppose que dans le cas entièrement paramétré, une décomposition de Cholesky est utilisée pour assurer une définition et une symétrie positives.
Réponses:
Le lien Goldstein .pdf @probabilityislogic est un excellent document. Voici une liste de quelques références qui discutent de votre question particulière:
Harville, 1976: Extension du théorème de Gauss-Markov pour inclure l'estimation des effets aléatoires .
Harville, 1977: Approches du maximum de vraisemblance pour l'estimation des composantes de la variance et les problèmes connexes .
Laird et Ware, 1982: modèles à effets aléatoires pour les données longitudinales .
McCulloch, 1997: Algorithmes de maximum de vraisemblance pour les modèles mixtes linéaires généralisés .
L' extrait du Guide de l'utilisateur SAS pour la procédure MIXTE contient d'excellentes informations sur l'estimation de la covariance et de nombreuses autres sources (à partir de la page 3968).
Il existe de nombreux manuels de qualité sur l'analyse des données des mesures longitudinales / répétées, mais en voici un qui donne quelques détails sur la mise en œuvre dans R (des auteurs de
lme4
etnlme
):Pinheiro et Bates, 2000: Modèles à effets mixtes en S et S-PLUS .
EDIT : Un autre article pertinent: Lindstrom et Bates, 1988: Newton-Raphson et algorithmes EM pour les modèles linéaires à effets mixtes pour les données de mesures répétées .
EDIT 2 : Et un autre: Jennrich et Schluchter, 1986: Modèles de mesures répétées déséquilibrées avec des matrices de covariance structurées .
la source
lme4
et de voir comment il traite cette estimation.Harvey Goldstein n'est pas un mauvais point de départ.
Comme pour les méthodes d'estimation les plus complexes, elle varie en fonction du progiciel. Cependant, ce qui est souvent fait est dans les étapes suivantes:
Une méthode simple et rapide est IGLS, qui est basée sur l'itération entre deux procédures des moindres carrés, et est décrite en détail dans le chapitre deux. L'inconvénient est que cela ne fonctionne pas bien pour les composants de variance proches de zéro.
la source
L'article suivant donne une solution sous forme fermée pour D:
la source
deux autres références qui pourraient être utiles Composants de variance par Searle et al et Lynch et Walsh Genetics and Analysis of Quantitative Traits . Le livre de Lynch et Walsh donne un algorithme étape par étape si je me souviens bien
la source