Y a-t-il jamais une raison de ne pas utiliser de polynômes orthogonaux lors de l'ajustement des régressions?

13

En général, je me demande s'il est toujours préférable de ne pas utiliser de polynômes orthogonaux lors de l'ajustement d'une régression avec des variables d'ordre supérieur. En particulier, je me demande avec l'utilisation de R:

Si poly()avec raw = FALSEproduit les mêmes valeurs ajustées poly()qu'avec raw = TRUE, et polyavec raw = FALSErésout certains des problèmes associés aux régressions polynomiales, alors poly()avec devrait-il raw = FALSE toujours être utilisé pour ajuster les régressions polynomiales? Dans quelles circonstances serait-il préférable de ne pas utiliser poly()?

user2374133
la source

Réponses:

16

Jamais une raison? Sûr; probablement plusieurs.

Considérez, par exemple, où je m'intéresse aux valeurs des coefficients bruts (disons pour les comparer avec des valeurs hypothétiques), et la colinéarité n'est pas un problème particulier. C'est à peu près la même raison pour laquelle je ne parle souvent pas de centre dans la régression linéaire ordinaire (qui est le polynôme orthogonal linéaire)

Ce ne sont pas des choses que vous ne pouvez pas gérer via des polynômes orthogonaux; c'est plus une question de commodité, mais la commodité est une grande raison pour laquelle je fais beaucoup de choses.

Cela dit, je penche vers les polynômes orthogonaux dans de nombreux cas tout en ajustant les polynômes, car ils présentent des avantages distincts.

Glen_b -Reinstate Monica
la source
est-il possible de comparer les coefficients résultant d'une régression polynomiale orthogonale à des valeurs hypothétiques?
user2374133
2
Oui. Vous pouvez les retransformer aux coefficients implicites et aux erreurs standard des polynômes "bruts", par exemple.
Glen_b -Reinstate Monica
2
Plus souvent qu'autrement, la conversion de la base polynomiale orthogonale à la base monomiale est un processus mal conditionné (pour les degrés élevés; la conversion à bas degré n'est pas trop mauvaise), donc si l'on s'intéresse a priori aux coefficients de la base monomiale, tout la stabilité numérique que vous avez acquise en utilisant les polynômes orthogonaux est jetée par la fenêtre lors de la conversion, vous pouvez donc aussi bien utiliser des monômes au début. Caveat emptor , bien sûr.
JM n'est pas statisticien le
1
@JM Merci, c'est un excellent point. Heureusement, il serait très rare de nos jours dans les applications statistiques de s'adapter à un polynôme d'ordre assez bas (mon conseil habituel est qu'à moins qu'il y ait une raison théorique solide d'aller au-dessus du degré trois ou quatre, on devrait examiner différentes approches - quelle alternative peut être mieux dépend des circonstances, mais des choses comme les splines, par exemple, peuvent convenir à certaines situations.).
Glen_b -Reinstate Monica
13

Parce que si votre modèle quitte R lorsqu'il grandit, vous devez vous rappeler d'emballer ses constantes de centrage et de normalisation, puis il doit les trimballer tout le temps. Imaginez le rencontrer un jour codé en dur dans SQL, et l'horreur de réaliser qu'il les a égarés!

Scortchi - Réintégrer Monica
la source