Test de non-linéarité dans la régression logistique (ou d'autres formes de régression)

13

L'une des hypothèses de régression logistique est la linéarité du logit. Donc, une fois mon modèle opérationnel, je teste la non-linéarité en utilisant le test de Box-Tidwell. Un de mes prédicteurs continus (X) s'est révélé positif pour la non-linéarité. Que dois-je faire ensuite?

Comme il s'agit d'une violation des hypothèses, dois-je me débarrasser du prédicteur (X) ou inclure la transformation non linéaire (X * X). Ou transformer la variable en un catégorique? Si vous avez une référence, pourriez-vous me l'indiquer également?

tosonb1
la source

Réponses:

8

Je suggérerais d'utiliser des splines cubiques restreintes ( rcsdans R, voir les packages Hmisc et Design pour des exemples d'utilisation), au lieu d'ajouter la puissance de dans votre modèle. Cette approche est celle recommandée par Frank Harrell, par exemple, et vous trouverez une belle illustration dans ses documents (§2.5 et chap. 9) sur les stratégies de modélisation de la régression (voir le site Web d'accompagnement ).X

Vous pouvez comparer les résultats avec votre test Box-Tidwell en utilisant le boxTidwell()dans le package de voiture .

Transformer des prédicteurs continus en prédicteurs catégoriels n'est généralement pas une bonne idée, voir par exemple les problèmes causés par la catégorisation des variables continues .

chl
la source
5

Il peut être approprié d'inclure une transformation non linéaire de x , mais probablement pas simplement x × x , c'est-à-dire x 2 . Je pense que vous pouvez trouver cela une référence utile pour déterminer quelle transformation utiliser:

GEP Box et Paul W. Tidwell (1962). Transformation des variables indépendantes. Technometrics Volume 4 Numéro 4, pages 531-550. http://www.jstor.org/stable/1266288

Certains considèrent que la famille de transformations de Box-Tidwell est plus générale qu'il n'est souvent approprié pour l'interprétabilité et la parcimonie. Patrick Royston et Doug Altman ont présenté le terme polynômes fractionnaires pour les transformations de Box-Tidwell avec des puissances rationnelles simples dans un article influent de 1994:

P. Royston et DG Altman (1994). Régression utilisant des polynômes fractionnaires de covariables continues: modélisation paramétrique parcimonieuse. Statistiques appliquées, volume 43: pages 429–467. http://www.jstor.org/stable/2986270

Patrick Royston en particulier a continué à travailler et à publier des articles et des logiciels à ce sujet, aboutissant à un livre avec Willi Sauerbrei:

P. Royston et W. Sauerbrei (2008). Création de modèles multivariés: une approche pragmatique de l'analyse de régression basée sur des polynômes fractionnaires pour la modélisation de variables continues . Chichester, Royaume-Uni: Wiley. ISBN 978-0-470-02842-1

un arrêt
la source
4

N'oubliez pas de vérifier les interactions entre X et d'autres variables indépendantes. Laisser les interactions non modélisées peut donner à X l'impression d'avoir un effet non linéaire alors qu'il n'a simplement qu'un effet non additif.

conjugateprior
la source
Bon point. Je n'ai rencontré que l'inverse: supposer qu'un effet est linéaire lorsqu'il ne l'est pas peut conduire à de fausses preuves statistiques pour les termes d'interaction multiplicative.
onestop
1
@onestop, avez-vous une référence à ce sujet? Je le crois, mais j'ai du mal à comprendre exactement pourquoi cela se produirait.
Macro