La régression pas à pas avait été surutilisée dans de nombreux articles biomédicaux dans le passé, mais cela semble s'améliorer avec une meilleure éducation de ses nombreux problèmes. De nombreux critiques plus âgés le demandent cependant. Quelles sont les circonstances dans lesquelles la régression pas à pas a un rôle et devrait être utilisée, le cas échéant?
regression
multiple-regression
feature-selection
model-selection
stepwise-regression
bobmcpop
la source
la source
Réponses:
Bien sûr, la raison pour laquelle la plupart des gens sont tentés de faire quelque chose comme une régression pas à pas est,
C'est-à-dire qu'une méthode comme la régression pas à pas serait (si elle avait de bonnes caractéristiques de fonctionnement) particulièrement intéressante dans ces situations, quand elle n'avait pas de bonnes caractéristiques de fonctionnement.
la source
Deux cas dans lesquels je ne m'opposerais pas à une régression par étapes sont
Dans ces deux cas d'utilisation très importants, vous n'êtes pas tellement préoccupé par l'inférence statistique traditionnelle, donc le fait que les valeurs p, etc., ne soient plus valables est peu préoccupant.
Par exemple, si un document de recherche disait "Dans notre étude pilote, nous avons utilisé une régression pas à pas pour trouver 3 variables intéressantes sur 1000. Dans une étude de suivi avec de nouvelles données, nous avons montré que ces 3 variables intéressantes étaient fortement corrélées avec la résultat d'intérêt ", je n'aurais aucun problème avec l'utilisation de la régression pas à pas. De même, "Nous avons utilisé une régression pas à pas pour construire un modèle prédictif. Ce modèle alternatif X préformé dans notre ensemble de données sur les MSE" me convient parfaitement.
Pour être clair, je ne dis pas que la régression par étapes est la meilleure façon d'aborder ces problèmes. Mais c'est facile et peut vous donner des solutions satisfaisantes.
ÉDITER:
Dans les commentaires, la question se pose de savoir si l'AIC par étapes peut réellement être utile pour la prédiction. Voici une simulation qui montre qu'il fait beaucoup mieux que la régression linéaire avec toutes les covariables, et presque aussi bien que les réseaux élastiques avec la pénalité choisie par validation croisée.
Je ne prendrais pas cette simulation comme la fin de la discussion; il n'est pas trop difficile de trouver un scénario dans lequel l'AIC par étapes se comportera moins bien. Mais ce n'est vraiment pas un scénario déraisonnable, et exactement le type de situation pour laquelle les filets élastiques sont conçus (forte corrélation des covariables avec très peu d'effets importants)!
Note latérale:
Je ne suis vraiment pas un fan de la régression pas à pas pour de nombreuses raisons, donc je me sens un peu maladroit d'avoir pris cette position pour la défendre. Mais je pense simplement qu'il est important d'être précis sur ce que je n'aime pas.
la source