Je réfléchis à la discussion autour de cette question et en particulier au commentaire de Frank Harrell selon lequel l'estimation de la variance dans un modèle réduit (c'est-à-dire à partir duquel un certain nombre de variables explicatives ont été testées et rejetées) devrait utiliser les degrés de liberté généralisés de Ye . Le professeur Harrell souligne que cela sera beaucoup plus proche des degrés de liberté résiduels du modèle original "complet" (avec toutes les variables) que de celui d'un modèle final (dont un certain nombre de variables ont été rejetées).
Question 1. Si je veux utiliser une approche appropriée pour tous les résumés et statistiques standard d'un modèle réduit (mais sans une mise en œuvre complète des degrés de liberté généralisés), une approche raisonnable consisterait-elle à simplement utiliser les degrés de liberté résiduels de le modèle complet dans mes estimations de la variance résiduelle, etc.?
Question 2. Si ce qui précède est vrai et que je veux le faire, cela R
pourrait-il être aussi simple que de définir
finalModel$df.residual <- fullModel$df.residual
à un moment donné de l'exercice d'ajustement du modèle, où finalModel et fullModel ont été créés avec lm () ou une fonction similaire. Après quoi, des fonctions telles que summary () et confint () semblent fonctionner avec le df.residual souhaité, bien que renvoyant un message d'erreur que quelqu'un a clairement contourné avec l'objet finalModel.
la source
lmer
sortie. Voir son raisonnement ici .Réponses:
Êtes-vous en désaccord avec la réponse de @ FrankHarrel selon laquelle la parcimonie s'accompagne de vilains compromis scientifiques, de toute façon?
J'adore le lien fourni dans le commentaire de @ MikeWiezbicki vers la justification de Doug Bates. Si quelqu'un n'est pas d'accord avec votre analyse, il peut le faire à sa façon, et c'est une façon amusante de lancer une discussion scientifique sur vos hypothèses de base. Une valeur p ne fait pas de votre conclusion une "vérité absolue".
la source