En pratique, comment la matrice de covariance des effets aléatoires est-elle calculée dans un modèle à effets mixtes?

19

Fondamentalement, je me demande comment les différentes structures de covariance sont appliquées et comment les valeurs à l'intérieur de ces matrices sont calculées. Des fonctions comme lme () nous permettent de choisir quelle structure nous aimerions, mais j'aimerais savoir comment elles sont estimées.

Considérons le modèle à effets mixtes linéaires Y=Xβ+Zu+ϵ .

Où et . En outre:ϵ d N ( 0 , R )udN(0,D)ϵdN(0,R)

Var(Y|X,Z,β,u)=R

Var(Y|X,β)=ZDZ+R=V

Pour simplifier, nous supposerons .R=σ2In

Fondamentalement, ma question est: comment exactement est-il estimé à partir des données pour les différentes paramétrisations? Dites si nous supposons que est diagonal (les effets aléatoires sont indépendants) ou entièrement paramétré (cas qui m'intéresse plus pour le moment) ou l'une des diverses autres paramétrisations? Existe-t-il des estimateurs / équations simples pour ceux-ci? (Cela serait sans doute estimé itérativement.)D DDDD

EDIT: Du livre Variance Components (Searle, Casella, McCulloch 2006), j'ai réussi à briller ce qui suit:

Si alors les composantes de la variance sont mises à jour et calculées comme suit:D=σu2Iq

σu2(k+1)=u^Tu^σu2(k)trace(V1ZTZ)

σe2(k+1)=Y(YXβ^(k)Zu^(k))/n

β ( k ) et u ( k ) sont les k ème jour respectivement.β^(k)u^(k)k

Existe-t-il des formules générales lorsque est en diagonale de bloc ou entièrement paramétré? Je suppose que dans le cas entièrement paramétré, une décomposition de Cholesky est utilisée pour assurer une définition et une symétrie positives.D

dcl
la source
2
arxiv.org/pdf/1406.5823 (sous presse au Journal of Statistical Software ) pourrait être utile ...
Ben Bolker

Réponses:

8

Le lien Goldstein .pdf @probabilityislogic est un excellent document. Voici une liste de quelques références qui discutent de votre question particulière:

Harville, 1976: Extension du théorème de Gauss-Markov pour inclure l'estimation des effets aléatoires .

Harville, 1977: Approches du maximum de vraisemblance pour l'estimation des composantes de la variance et les problèmes connexes .

Laird et Ware, 1982: modèles à effets aléatoires pour les données longitudinales .

McCulloch, 1997: Algorithmes de maximum de vraisemblance pour les modèles mixtes linéaires généralisés .

L' extrait du Guide de l'utilisateur SAS pour la procédure MIXTE contient d'excellentes informations sur l'estimation de la covariance et de nombreuses autres sources (à partir de la page 3968).

Il existe de nombreux manuels de qualité sur l'analyse des données des mesures longitudinales / répétées, mais en voici un qui donne quelques détails sur la mise en œuvre dans R (des auteurs de lme4et nlme):

Pinheiro et Bates, 2000: Modèles à effets mixtes en S et S-PLUS .

EDIT : Un autre article pertinent: Lindstrom et Bates, 1988: Newton-Raphson et algorithmes EM pour les modèles linéaires à effets mixtes pour les données de mesures répétées .

EDIT 2 : Et un autre: Jennrich et Schluchter, 1986: Modèles de mesures répétées déséquilibrées avec des matrices de covariance structurées .


la source
J'ai jeté un coup d'œil à Pinheiro et Bates, en particulier au chapitre 2 (sur la théorie et le calcul), mais je ne semblais rien éclairer sur la façon dont la structure de covariance est appliquée et estimée? J'y reviendrai bientôt. J'ai quelques-uns de ces papiers juste assis ici, je vais certainement devoir les relire. À votre santé.
dcl
1
@dcl En repensant au chapitre 2 de P&B, je vois qu'ils peuvent passer sous silence certaines des étapes qui vous intéressent (ils mentionnent l'optimisation de la vraisemblance logarithmique par rapport aux paramètres de covariance mais ne disent pas comment ). Cela étant dit, la section 2.2.8 est peut-être la section qui répond le mieux à votre question.
1
@dcl Ajout d'une source supplémentaire qui peut vous aider.
merci pour les liens. J'ai parcouru ces articles dans le passé, certains d'entre eux sont assez techniques pour moi. Je vais les parcourir à nouveau maintenant, mais à première vue, je n'arrive pas à obtenir ce que je veux d'eux.
DCL
1
@dcl Désolé pour le mur de liens, mais votre question est celle dont une personne peut passer quelques conférences complètes à discuter (c'est une très bonne question qui est en quelque sorte balayée sous le tapis lors de la première découverte des modèles à effets mixtes). En plus de parcourir la littérature, une chose que vous pourriez faire est de regarder le code source lme4et de voir comment il traite cette estimation.
7

Harvey Goldstein n'est pas un mauvais point de départ.

Comme pour les méthodes d'estimation les plus complexes, elle varie en fonction du progiciel. Cependant, ce qui est souvent fait est dans les étapes suivantes:

  1. DD0RR0i=1
  2. D=Di1R=Ri1βuϵβiuiϵi
  3. β=βiu=uiϵ=ϵiDRDiRi
  4. i=i+1

Une méthode simple et rapide est IGLS, qui est basée sur l'itération entre deux procédures des moindres carrés, et est décrite en détail dans le chapitre deux. L'inconvénient est que cela ne fonctionne pas bien pour les composants de variance proches de zéro.

probabilitéislogique
la source
Je sais que c'est la méthode générale, mais comment sont estimés D et R, quelles sont les équations utilisées pour les différentes structures? Quelles sont les bonnes valeurs initiales? Je vais consulter le pdf maintenant, cheers.
DCL