Équivalence des valeurs AIC et p dans la sélection du modèle

9

Dans un commentaire à la réponse à cette question , il a été déclaré que l'utilisation de l'AIC dans la sélection du modèle équivalait à l'utilisation d'une valeur p de 0,154.

Je l'ai essayé dans R, où j'ai utilisé un algorithme de sélection de sous-ensemble "en arrière" pour éliminer les variables d'une spécification complète. Premièrement, en jetant séquentiellement la variable avec la valeur p la plus élevée et en s'arrêtant lorsque toutes les valeurs p sont inférieures à 0,154 et, deuxièmement, en supprimant la variable qui se traduit par le plus faible AIC lorsqu'elle est supprimée jusqu'à ce qu'aucune amélioration ne puisse être apportée.

Il s'est avéré qu'ils donnent à peu près les mêmes résultats lorsque j'utilise une valeur de p de 0,154 comme seuil.

Est-ce vraiment vrai? Si oui, quelqu'un sait-il pourquoi ou peut-il se référer à une source qui l'explique?

PS Je ne pouvais pas demander à la personne de commenter ou d'écrire un commentaire, car je viens de m'inscrire. Je suis conscient que ce n'est pas l'approche la plus appropriée pour la sélection et l'inférence de modèles, etc.

Niels
la source
(1) Modélisation pronostique avec analyse de régression logistique: comparaison des méthodes de sélection et d'estimation dans de petits ensembles de données. Statistics in Medicine, 19, 1059-1079 (2) vrai pour les variables avec df1, basé sur la définition aic. Mais pourrait être plus bas si vos degrés de liberté des variables sont plus élevés
charles

Réponses:

13

χ2χ2α=0,157αα

Frank Harrell
la source
+1 J'ai passé tellement de temps à construire ma réponse (maintenant supprimée), je n'ai même pas vu que celle-ci avait posté entre-temps. J'aurais juste voté celui-ci à la place.
Glen_b -Reinstate Monica