Je souhaite apprendre (et implémenter) une alternative à l'interpolation polynomiale.
Cependant, j'ai du mal à trouver une bonne description de la façon dont ces méthodes fonctionnent, comment elles sont liées et comment elles se comparent.
J'apprécierais votre contribution sur les avantages / inconvénients / conditions dans lesquelles ces méthodes ou alternatives seraient utiles, mais quelques bonnes références aux textes, diapositives ou podcasts seraient suffisantes.
interpolation
splines
David LeBauer
la source
la source
Réponses:
La régression OLS de base est une très bonne technique pour ajuster une fonction à un ensemble de données. Cependant, régression simple ne correspond à une ligne droite qui est constante pour toute la gamme possible de . Cela peut ne pas convenir à une situation donnée. Par exemple, les données montrent parfois une relation curviligne . Ceci peut être traité en régressant sur une transformation de , . Différentes transformations sont possibles. Dans les situations où la relation entre et est monotone , mais diminue progressivement, une transformation logarithmiqueY X f ( X ) X Y X X 2 X 3X Oui X F( X) X Oui peut être utilisé. Un autre choix populaire consiste à utiliser un polynôme où de nouveaux termes sont formés en élevant à une série de pouvoirs (par exemple, , , etc.). Cette stratégie est facile à mettre en œuvre et vous pouvez interpréter l'ajustement comme vous indiquant le nombre de `` plis '' existant dans vos données (où le nombre de plis est égal à la puissance la plus élevée requise moins 1). X X2 X3
Cependant, les régressions basées sur le logarithme ou un exposant de la covariable ne s'adapteront de manière optimale que lorsque c'est la nature exacte de la vraie relation. Il est tout à fait raisonnable d'imaginer qu'il existe une relation curviligne entre et différente des possibilités offertes par ces transformations. Ainsi, nous arrivons à deux autres stratégies. La première approche est le loess , une série de régressions linéaires pondérées calculées sur une fenêtre mobile. Cette approche est plus ancienne et mieux adaptée à l'analyse exploratoire des données . YX Oui
L'autre approche consiste à utiliser des splines. A c'est plus simple, une spline est un nouveau terme qui s'applique à une partie seulement de la plage de . Par exemple, peut aller de 0 à 1, et le terme spline ne peut aller que de 0,7 à 1. Dans ce cas, 0,7 est le nœud . Un terme de spline simple et linéaire serait calculé comme suit: et serait ajouté à votre modèle, en plus du origineX X s p l i n e = { 0X X XX 3 s p l i n e
La plus simple introduction à ces sujets que je connaisse est:
la source
Les notes en ligne de Cosma Shalizi sur son cours magistral Advanced Data Analysis from an Elementary Point of View sont assez bonnes à ce sujet, considérant les choses dans une perspective où l'interpolation et la régression sont deux approches du même problème. Je voudrais particulièrement attirer votre attention sur les chapitres sur les méthodes de lissage et les splines .
la source