Ai-je calculé ces rapports de vraisemblance correctement?

18

Je suis l'auteur du package ez pour R, et je travaille sur une mise à jour pour inclure le calcul automatique des rapports de vraisemblance (LR) dans la sortie des ANOVA. L'idée est de fournir un LR pour chaque effet qui est analogue au test de cet effet que l'ANOVA réalise. Par exemple, le LR pour l'effet principal représente la comparaison d'un modèle nul avec un modèle qui inclut l'effet principal, le LR pour une interaction représente la comparaison d'un modèle qui comprend à la fois les effets principaux des composants et un modèle qui comprend à la fois les effets principaux et leur interaction, etc.

Maintenant, ma compréhension du calcul LR vient de Glover & Dixon ( PDF ), qui couvre les calculs de base ainsi que les corrections de complexité, et l'annexe de Bortolussi & Dixon ( annexe PDF ), qui couvre les calculs impliquant des variables à mesures répétées. Pour tester ma compréhension, j'ai développé cette feuille de calcul , qui prend les dfs et les SS à partir d'un exemple d'ANOVA (généré à partir d'une conception 2 * 2 * 3 * 4 utilisant de fausses données) et parcourt le calcul du LR pour chaque effet.

J'apprécierais vraiment que quelqu'un avec un peu plus de confiance avec un tel calcul puisse jeter un œil et s'assurer que j'ai tout fait correctement. Pour ceux qui préfèrent le code abstrait, voici le code R implémentant la mise à jour de ezANOVA () (voir en particulier les lignes 15-95).

Mike Lawrence
la source

Réponses:

3

Bien que le raisonnement sur le calcul du LR à partir des valeurs SS soit assez juste, une méthode des moindres carrés est équivalente mais pas la même chose qu'une estimation de vraisemblance. (La différence peut être illustrée par exemple dans le calcul de la se, qui est divisé par (n-1) dans une approche des moindres carrés et divisé par n dans un maximum de vraisemblance. L'estimation du maximum de vraisemblance est donc cohérente, mais légèrement biaisée ).

Cela a quelques implications: vous pouvez calculer le LR car la probabilité est proportionnelle à , mais cela ne vous donne pas la probabilité de votre modèle anova lui-même. Il vous dit juste quelque chose sur le ratio. Comme l'AIC est classiquement définie en termes de probabilité, je ne sais pas si vous pouvez utiliser l'AIC comme vous le souhaitez.1s

J'ai regardé la feuille de calcul, mais les valeurs pour le "LR non corrigé à l'intérieur" (je ne suis pas non plus complètement ce que vous essayez de calculer là-bas) me semblent très improbables.

D'un côté, la puissance du test LR est que vous pouvez simplement contraster les modèles que vous voulez, vous n'avez pas à le faire pour tous (ce qui réduit l'erreur de multitest). Si vous faites cela pour chaque terme, votre LR est complètement équivalent à un test F, et dans le cas des moindres carrés, pour autant que je sache même numériquement à peu près la même chose.

Votre mile peut varier, mais je n'ai jamais été convaincu de mélanger les concepts de deux cadres différents (c'est-à-dire les moindres carrés par rapport à la probabilité maximale). Personnellement, je rapporterais les statistiques F et implémenterais le LR dans une fonction qui permet de comparer les modèles (par exemple la fonction anova pour les modèles lme qui fait exactement cela).

Mes 2 cents.

PS: J'ai regardé votre code, mais je n'ai pas vraiment pu comprendre toutes les variables. Si vous annotiez votre code à l'aide de commentaires, cela rendrait la vie un peu plus facile. La feuille EXCEL n'est pas non plus la plus simple à comprendre. Je vérifierai plus tard pour voir si je peux en faire quelque chose.

Joris Meys
la source