Je me demandais si quelqu'un pouvait m'éclairer sur les différences actuelles entre ces deux fonctions. J'ai trouvé la question suivante: Comment choisir la bibliothèque nlme ou lme4 R pour les modèles d'effets mixtes? , mais cela remonte à quelques années. C'est toute une vie dans les cercles logiciels.
Mes questions spécifiques sont:
- Existe-t-il (encore) des structures de corrélation
lme
quilmer
ne gèrent pas? - Est-il possible / recommandé d'utiliser
lmer
pour les données de panel?
Toutes mes excuses si elles sont quelque peu basiques.
Un peu plus en détail: les données de panel sont l'endroit où nous avons plusieurs mesures sur les mêmes individus, à différents moments. Je travaille généralement dans un contexte commercial, où vous pouvez disposer de données pour les clients réguliers / à long terme sur plusieurs années. Nous voulons permettre une variation dans le temps, mais il est inefficace d'ajuster clairement une variable fictive pour chaque mois ou année. Cependant, je ne sais pas si lmer
c'est l'outil approprié pour ce type de données, ou si j'ai besoin des structures d'autocorrélation qui l' lme
ont.
la source
lmer
ne gère toujours pas la variété des structures de corrélation et de variance qui lelme
fait, et si je comprends bien la situation, cela ne le sera probablement jamais.lmer
t-il la capacité de gérer le jeu de données du panneau? Ou puis-je m'en tirer sans faire d'hypothèses de corrélation spécifiques?lmer
les gérer ... Hong, pouvez-vous ajouter une brève explication à la question qui décrit les propriétés statistiques nécessaires de manière un peu plus détaillée, ou donne des pointeurs?lmer
serait plutôt bien avec un effet aléatoire de l'année et un effet aléatoire du client (disons que vous n'avez qu'une seule mesure par client et par an); si vous avez une tendance temporelle globale (à effet fixe), vous devez également envisager une interaction temps par client aléatoire (c'est-à-dire des pentes aléatoires). Idéalement, vous voudriez également permettre une autocorrélation temporelle dans la série chronologique de chaque client, ce qui n'est pas possible pour le moment avec lmer, mais vous pouvez vérifier la fonction d'autocorrélation temporelle pour voir si cela était important ...Réponses:
MISE À JOUR JUIN 2016:
S'il vous plaît voir l'entrée de blog de Ben décrivant ses réflexions actuelles sur l'accomplissement de cette tâche dans
lme4
: Braindump 01 juin 2016Si vous préférez les méthodes bayésiennes, le
brms
paquetbrm
prend en charge certaines structures de corrélation: page CRAN brms . (Remarque en particulier: "À partir de la version 0.6.0 de brms, la structure AR fait référence aux effets autorégressifs des résidus pour correspondre au nom et à l'implémentation dans d'autres packages tels que nlme. Auparavant, le terme AR dans brms faisait référence aux effets autorégressifs de la réponse. Ces derniers sont désormais appelés effets ARR et peuvent être modélisés à l'aide de l'argument r dans les fonctions cor_arma et cor_arr. ")RÉPONSE ORIGINALE JUILLET 2013:
(Converti à partir d'un commentaire.)
Je dirais que ce
lmer
serait plutôt bien avec un effet aléatoire de l'année et un effet aléatoire du client (disons que vous n'avez qu'une seule mesure par client et par an);correspondrait au modèle (interception uniquement)
Il s'agit d'un modèle assez ennuyeux, vous voudrez peut-être ajouter une tendance temporelle globale (à effet fixe) et également envisager une interaction aléatoire temps par client (c'est-à-dire des pentes aléatoires). je pense
(l'utilisation
year
de cette manière est une exception à la règle habituelle de ne pas inclure une variable d'entrée en tant qu'effet ajusté et aléatoire dans le même modèle; à condition qu'il s'agisse d'une variable numérique,year
est traitée comme continue dans l'effet fixe et leyear:customer
(aléatoire) interaction et aussi catégorique dans l'effet aléatoire ...)Bien sûr, vous voudrez peut-être ajouter des covariables au niveau de l'année, au niveau du client et au niveau de l'observation qui absorberaient une partie de la variance pertinente (par exemple, ajouter un indice des prix à la consommation moyen pour expliquer pourquoi les années étaient mauvaises ou bonnes ...)
Idéalement, vous voudriez également permettre une autocorrélation temporelle dans les séries temporelles de chaque client, ce qui n'est pas possible pour le moment
lmer
, mais vous pouvez vérifier la fonction d'autocorrélation temporelle pour voir si cela était important ...Mise en garde : Je ne sais pas grand-chose sur les approches standard pour gérer les données du panel; ceci est basé uniquement sur ma connaissance des modèles mixtes. Les commentateurs (ou rédacteurs en chef) devraient se sentir libres d'intervenir si cela semble enfreindre les normes / meilleures pratiques en économétrie.
la source
Pour répondre directement à vos questions, et NB c'est des années après le message d'origine!
Oui, il existe encore des structures de corrélation que nlme gère et que lme4 ne gère pas. Cependant, tant que nlme permet à l'utilisateur de définir les corstrs généraux et que lme4 ne le fait pas, ce sera le cas. Cela a étonnamment peu d'impact pratique. Les "trois grands" structures de corrélation de: Les structures de corrélation indépendantes, échangeables et AR-1 sont faciles à gérer par les deux packages.
C'est certainement possible . Vous pouvez également adapter les données du panneau avec la
lm
fonction! Ma recommandation concernant l'utilisation dépend du problème.lme4
est une trousse à outils beaucoup plus petite, et la représentation des formules est une manière claire et concise de décrire certains modèles d'effets mixtes très courants.nlme
est la très grande boîte à outils, y compris une soudeuse TIG pour fabriquer tous les outils dont vous avez besoin.Vous dites que vous voulez permettre une "variation dans le temps". Essentiellement, une structure de corrélation échangeable y parvient, permettant une interception aléatoire dans chaque cluster, de sorte que la variance intracluster est la somme de la variation au niveau du cluster ainsi que (ce que vous appelez) la variation dans le temps. Et cela ne vous dissuade nullement d'utiliser des effets fixes pour obtenir des prédictions plus précises dans le temps.
la source