Je travaille actuellement sur une série de modèles de séries chronologiques de Poisson essayant d'estimer l'effet d'un changement dans la façon dont les chiffres ont été obtenus (passage d'un test de diagnostic à un autre) tout en contrôlant d'autres tendances au fil du temps (par exemple, une augmentation générale de la incidence de la maladie). J'ai des données pour un certain nombre de sites différents.
Bien que j'aie aussi bricolé avec les GAM, j'ai adapté une série de GLM assez basiques avec les tendances temporelles, puis j'ai regroupé les résultats. Le code pour cela ressemblerait à ceci dans SAS:
PROC GENMOD data=work.data descending;
model counts = dependent_variable time time*time / link=log dist = poisson;
run;
ou ceci dans R:
glm(counts ~ dependent_variable + time + time*time, family="poisson")
Prendre ensuite ces estimations et les regrouper sur les différents sites. Il a également été suggéré que j'essaie d'utiliser un modèle mixte de Poisson avec une pente aléatoire et une interception pour chaque site, plutôt que de mettre en commun. Donc, essentiellement, vous auriez l'effet fixe de variable_dépendante, puis un effet aléatoire pour l'interception et le temps (ou idéalement le temps et le temps ^ 2, même si je comprends que cela devient un peu velu).
Mon problème est que je n'ai aucune idée de comment adapter l'un de ces modèles, et il semble que les modèles mixtes sont où la documentation de tout le monde devient soudainement très opaque. Quelqu'un a-t-il une explication (ou un code) simple sur la façon de s'adapter à ce que je cherche à adapter, et à quoi faire attention?
g <- lmer(y ~ x + (1+t+I(t^2)|ID), family="poisson")
), le temps de calcul est passé d'environ 0,75 seconde à environ 11 secondes. À mesure que la taille de l'échantillon augmente, l'augmentation du temps de calcul augmente probablement également.En SAS:
Mais bien sûr, il existe de nombreuses options, plus ou moins utiles, pour jouer avec.
la source