Ceci est mon premier message posté. Je suis vraiment reconnaissant envers cette communauté.
J'essaie d'analyser des données de comptage longitudinal qui sont tronquées à zéro (probabilité que la variable de réponse = 0 soit 0) et la moyenne! = Variance, donc une distribution binomiale négative a été choisie par rapport à un poisson.
Fonctions / commandes que j'ai exclues:
R
- La fonction gee () dans R ne tient pas compte de la troncature nulle ni de la distribution binomiale négative (même avec le paquet MASS chargé)
- glm.nb () dans R ne permet pas différentes structures de corrélation
- vglm () du package VGAM peut utiliser la famille posnegbinomial, mais il a le même problème que la commande ztnb de Stata (voir ci-dessous) en ce que je ne peux pas réaménager les modèles en utilisant une structure de corrélation non indépendante.
Stata
- Si les données n'étaient pas longitudinales, je pourrais simplement utiliser les packages Stata ztnb pour exécuter mon analyse, MAIS cette commande suppose que mes observations sont indépendantes.
J'ai également exclu GLMM pour diverses raisons méthodologiques / philosophiques.
Pour l'instant, je me suis installé sur la commande xtgee de Stata (oui, je sais que xtnbreg fait également la même chose) qui prend en compte à la fois les structures de corrélation non indépendantes et la famille binomiale neg, mais pas la troncature zéro. L'avantage supplémentaire de l'utilisation de xtgee est que je peux également calculer des valeurs qic (en utilisant la commande qic) pour déterminer les structures de corrélation les mieux adaptées à mes variables de réponse.
S'il y a un package / commande dans R ou Stata qui peut prendre en compte 1) la famille nbinomiale, 2) GEE et 3) la troncature zéro, je mourrais d'envie de le savoir.
J'apprécierais grandement toutes les idées que vous pourriez avoir. Je vous remercie.
-Casey
la source
gamlss
package qui pourrait également convenir à R dans la facture.Hmm, bonne première question! Je ne connais pas de package répondant à vos besoins précis. Je pense que le xtgee de Stata est un bon choix si vous spécifiez également l'
vce(robust)
option pour donner des erreurs standard Huber-White, ouvce(bootstrap)
si c'est pratique. L'une ou l'autre de ces options garantira une estimation cohérente des erreurs standard malgré la mauvaise spécification du modèle que vous aurez en ignorant la troncature zéro.Reste à savoir quel effet l'ignorance de la troncature zéro aura sur les estimations ponctuelles qui vous intéressent. Cela vaut la peine de faire une recherche rapide pour voir s'il existe de la documentation pertinente à ce sujet en général, c'est-à-dire pas nécessairement dans un contexte GEE - j'aurais pensé que vous pouvez supposer assez sûrement que de tels résultats seront également pertinents dans le cas GEE. Si vous ne trouvez rien, vous pouvez toujours simuler des données avec une troncature nulle et des estimations d'effet connues et évaluer le biais par simulation.
la source
J'ai eu le même problème dans ma thèse. Dans Stata, je viens de me créer un programme .ado personnalisé avec deux appels à xtgee.
Pour cela, j'ai trouvé les diapositives / programmes «Modélisation des coûts et des comptes des soins de santé» de Partha Deb, Willard Manning et Edward Norton utiles. Ils ne parlent pas de données longitudinales, mais c'est un point de départ utile.
la source
Je cherchais des réponses sur l'interprétation de glmmADMB et j'ai vu votre message. Je sais que c'était il y a longtemps, mais j'aurais peut-être la réponse.
Regardez dans le paquet glmmADMB lorsque vous utilisez des modèles de haies. Vous devez diviser en deux les analyses de vos données: l'une d'elles ne traite que les données non nulles. Vous pouvez ajouter des effets mixtes et choisir la distribution. La condition est que les données doivent être gonflées à zéro et je ne sais pas si cela correspond à vos besoins! Quoi qu'il en soit, j'espère que vous l'avez découvert il y a longtemps!
la source