Degrés de liberté résiduels appropriés après suppression des termes d'un modèle

Je réfléchis à la discussion autour de cette question et en particulier au commentaire de Frank Harrell selon lequel l'estimation de la variance dans un modèle réduit (c'est-à-dire à partir duquel un certain nombre de variables explicatives ont été testées et rejetées) devrait utiliser les degrés de liberté généralisés de Ye . Le professeur Harrell souligne que cela sera beaucoup plus proche des degrés de liberté résiduels du modèle original "complet" (avec toutes les variables) que de celui d'un modèle final (dont un certain nombre de variables ont été rejetées).

Question 1. Si je veux utiliser une approche appropriée pour tous les résumés et statistiques standard d'un modèle réduit (mais sans une mise en œuvre complète des degrés de liberté généralisés), une approche raisonnable consisterait-elle à simplement utiliser les degrés de liberté résiduels de le modèle complet dans mes estimations de la variance résiduelle, etc.?

Question 2. Si ce qui précède est vrai et que je veux le faire, cela Rpourrait-il être aussi simple que de définir

finalModel$df.residual <- fullModel$df.residual

à un moment donné de l'exercice d'ajustement du modèle, où finalModel et fullModel ont été créés avec lm () ou une fonction similaire. Après quoi, des fonctions telles que summary () et confint () semblent fonctionner avec le df.residual souhaité, bien que renvoyant un message d'erreur que quelqu'un a clairement contourné avec l'objet finalModel.

r regression model-selection regression-strategies Peter Ellis
la source

Bonne question. Cela est lié à la raison pour laquelle Douglas Bates n'inclut pas de valeurs de p dans la lmersortie. Voir son raisonnement ici .

J'ai vu le modèle complet df utilisé dans une telle situation plus d'une fois. (L'approche de Ye revient souvent dans différentes situations; c'est un document que je me recommande régulièrement aux gens. Ce serait bien d'avoir une fonction R générique mais efficace dont de nombreuses fonctions pourraient tirer parti.)

Glen_b -Reinstate Monica

Degrés de liberté résiduels appropriés après suppression des termes d'un modèle

Réponses: