Faut-il ajuster le dénombrement nul pour un test du rapport de vraisemblance des modèles poisson / loglinear?

9

S'il y a des 0 dans le tableau de contingence et que nous ajustons des modèles imbriqués poisson / loglinear (en utilisant la glmfonction de R ) pour un test de rapport de vraisemblance, devons-nous ajuster les données avant d'ajuster les modèles glm (par exemple, ajouter 1/2 à tous les chefs d'accusation)? Il est évident que certains paramètres ne peuvent pas être estimés sans un certain ajustement, mais comment l'ajustement / l'absence d'ajustement affecte-t-il le test LR?

BR1
la source
il est probable que la glmroutine serait bonne si elle ne pouvait pas gérer les zéros. L'as tu essayé?
shabbychef
1
oui, il ne plante pas, mais selon la formule (par exemple dans un modèle saturé), certains paramètres peuvent avoir des erreurs standard infinies. Ma question est de savoir si cela pose problème lors d'un test de rapport de vraisemblance. Vous pouvez toujours calculer une probabilité même si certains paramètres ne sont pas estimés, ces paramètres ne contribueront tout simplement pas à la probabilité. Quelle est la pratique standard et pourquoi?
BR1

Réponses:

7

L'un des pouvoirs de la modélisation de régression est généralement que vous pouvez lisser des zones sans données - bien que, comme vous l'avez remarqué, il y ait parfois des problèmes d'estimation des paramètres. Je dirais que si vous obtenez des choses comme des erreurs standard infinies, il est temps de reconsidérer un peu votre approche de modélisation.

Une mise en garde particulière: il y a une différence entre «N'avoir aucun dénombrement» dans une strate particulière et il est impossible qu'il y ait des dénombrements dans cette strate. Par exemple, imaginez que vous travaillez sur une étude des troubles psychologiques pour l'US Navy entre 2000 et 2009, et que vous avez des termes de régression binaire pour "Is a Woman" et "Serves on a Submarine". Un modèle de régression peut être capable d'estimer les effets où les deux variables = 1 malgré un nombre nul où les deux = 1. Cependant, cette inférence ne serait pas valide - une telle circonstance est impossible. Ce problème est appelé «non-positivité» et est parfois un problème dans les modèles hautement stratifiés.

Fomite
la source
@ skyguy94 Curieusement, je ne le sais pas - je le savais, j'avais juste oublié de noter l'utilisation d'un ensemble de données rétrospectives>. <. Modifié pour refléter cela.
Fomite
Re: "Un modèle de régression peut être capable d'estimer les effets où les deux variables = 1, ou les interactions entre les deux " - je ne pense pas que ce soit vrai. Si vous avez deux prédicteurs binaires qui ne sont jamais «1» ensemble, alors l'interaction est constante (elle est toujours «0»), donc son effet n'est pas identifié.
Macro
@Macro Vous avez raison, je modifie légèrement. Je pensais à des termes où ce ne sont pas des indicateurs binaires.
Fomite
1
(+1) Donc, les problèmes de non-plausibilité du cas où les deux = 1 mis à part, l'estimation basée sur le modèle ne serait que la somme des deux effets marginaux, qui, nous le savons, peuvent être très trompeurs en soi :)
Macro