S'il y a des 0 dans le tableau de contingence et que nous ajustons des modèles imbriqués poisson / loglinear (en utilisant la glm
fonction de R ) pour un test de rapport de vraisemblance, devons-nous ajuster les données avant d'ajuster les modèles glm (par exemple, ajouter 1/2 à tous les chefs d'accusation)? Il est évident que certains paramètres ne peuvent pas être estimés sans un certain ajustement, mais comment l'ajustement / l'absence d'ajustement affecte-t-il le test LR?
9
glm
routine serait bonne si elle ne pouvait pas gérer les zéros. L'as tu essayé?Réponses:
L'un des pouvoirs de la modélisation de régression est généralement que vous pouvez lisser des zones sans données - bien que, comme vous l'avez remarqué, il y ait parfois des problèmes d'estimation des paramètres. Je dirais que si vous obtenez des choses comme des erreurs standard infinies, il est temps de reconsidérer un peu votre approche de modélisation.
Une mise en garde particulière: il y a une différence entre «N'avoir aucun dénombrement» dans une strate particulière et il est impossible qu'il y ait des dénombrements dans cette strate. Par exemple, imaginez que vous travaillez sur une étude des troubles psychologiques pour l'US Navy entre 2000 et 2009, et que vous avez des termes de régression binaire pour "Is a Woman" et "Serves on a Submarine". Un modèle de régression peut être capable d'estimer les effets où les deux variables = 1 malgré un nombre nul où les deux = 1. Cependant, cette inférence ne serait pas valide - une telle circonstance est impossible. Ce problème est appelé «non-positivité» et est parfois un problème dans les modèles hautement stratifiés.
la source