Quelle est la valeur de p critique utilisée par la step()
fonction dans R pour la régression pas à pas? Je suppose que c'est 0,15, mais mon hypothèse est-elle correcte? Comment puis-je changer la valeur de p critique?
r
regression
p-value
stepwise-regression
Jason Samuels
la source
la source
Description
partie de la page d'aide?step
dit, dans son intégralité: Sélectionnez un modèle basé sur une formule par AIC.Réponses:
Comme je l'ai expliqué dans mon commentaire sur votre autre question,
step
utilise AIC plutôt que les valeurs p.Cependant, pour une seule variable à la fois, AIC ne correspondent à l' aide d' une valeur p de 0,15 (ou pour être plus précis, 0,1573):
Envisagez de comparer deux modèles, qui diffèrent par une seule variable. Appelez les modèles (modèle plus petit) et (modèle plus grand), et laissez leur AIC être et respectivement.M 1 AIC 0 AIC 1M0 M1 AIC0 AIC1
En utilisant le critère AIC, vous utiliseriez le modèle plus grand si . Ce sera le cas si . - 2 log L 0 - ( - 2 log L 1 ) > 2AIC1< AIC0 - 2 bûchesL0- ( - 2 journauxL1) > 2
Mais il s'agit simplement de la statistique d'un test de rapport de vraisemblance. D'après le théorème de Wilks, nous rejetterons la valeur nulle si la statistique dépasse le quantile supérieur d'un . Donc, si nous utilisons un test d'hypothèse pour choisir entre le modèle plus petit et le plus grand, nous choisissons le modèle plus grand lorsque .χ 2 1 - 2 log L 0 - ( - 2 log L 1 ) > C αα χ21 −2logL0−(−2logL1)>Cα
Maintenant, se situe au 84,27 centile d'un . Par conséquent, si nous choisissons le modèle plus grand lorsqu'il a un AIC plus petit, cela correspond au rejet de l'hypothèse nulle pour un test du terme supplémentaire avec une valeur de p de , ouχ 2 1 1 - 0,843 = 0,157 15,7 %2 χ21 1−0.843=0.157 15.7%
Alors, comment le modifiez-vous?
Facile. Modifiez le
k
paramètrestep
de 2 à autre chose. Vous voulez 10% à la place? Faites-en 2,7:Vous voulez 2,5%? Ensemble
k=5
:etc.
Cependant, même si cela résout votre question, je vous conseille de prêter une attention particulière à la réponse de Frank Harrell sur votre autre question, et de rechercher ici les réponses d'un grand nombre de statisticiens sur d'autres questions relatives à la régression pas à pas, dont les conseils ont tendance à être très systématiquement pour éviter les procédures par étapes en général.
la source
Comme indiqué ci-dessus, la
step
fonction dans R est basée sur des critères AIC. Mais je suppose que par valeur p, vous voulez dire alpha pour entrer et alpha pour quitter. Ce que vous pouvez faire est d'utiliser la fonctionstepwise
écrite par Paul Rubin et disponible ici . Comme vous pouvez le voir, vous avez les arguments alpha.to.enter et alpha.to.leave que vous pouvez modifier. Notez que cette fonction utilise le test F ou le test t équivalent pour sélectionner les modèles. De plus, il peut gérer non seulement la régression pas à pas mais aussi la sélection avant et l'élimination arrière si vous définissez correctement les arguments.la source