TLDR: Les splines de régression en plaques minces ont-elles une interprétation probabiliste / bayésienne?
Étant donné les paires entrée-sortie , ; Je veux estimer une fonction comme suit où est une fonction du noyau et est un vecteur caractéristique de taille . Les coefficients et peuvent être trouvés en résolvant où les lignes de \ Phi sont données par
et, avec un certain abus de notation, la jième entrée de la matrice du noyau est . Cela donne
En supposant que est une fonction de noyau définie positive, cette solution peut être considérée comme le meilleur prédicteur linéaire sans biais pour le modèle bayésien suivant:
où et désigne un processus gaussien. Voir par exemple https://www.ncbi.nlm.nih.gov/pmc/articles/PMC2665800/
Ma question est la suivante. Supposons que je laisse et , c'est-à-dire spline en plaque mince régression. Maintenant, n'est pas une fonction semi-définie positive et l'interprétation ci-dessus ne fonctionne pas. Le modèle ci-dessus et sa solution ont-ils toujours une interprétation probabiliste comme dans le cas où le est semi-défini positif?
Réponses:
Laissez le modèle de la question s'écrire où est un GP non observé avec index et est un terme de bruit normal avec variance . Le GP est généralement supposé être centré, stationnaire et non déterministe. Notez que le terme peut être considéré comme un GP (déterministe) avec noyau où
Voici deux exemples d'IRF pour . Considérons tout d'abord un processus de Wiener avec sa condition initiale remplacée par une condition initiale diffuse : est normal avec une variance infinie. Une fois qu'une valeur est connue, l'IRF peut être prédit comme l'est le GP de Wiener. Deuxièmement, considérons un processus de Wiener intégré donné par l'équation où est un processus de Wiener. Pour obtenir un GP, nous avons maintenant besoin de deux paramètres scalaires: deux valeurs et pourd=1 ζ(x) ζ(0)=0 ζ(0) ζ(x)
Pour une dimension générale , considérons un espace linéaire de fonctions définies sur . Nous appelons un incrément relatif à une collection finie de emplacements et poids réels tels que Considérez comme étant l'espace nul de nos exemples. Pour le premier exemple, nous pouvons prendre par exemple avec et arbitraire etd F Rd F s xi∈Rd s νi
Le calcul de la prédiction de l'IRF est presque le même que dans la question, avec remplacé par , mais avec le formant maintenant une base de . La contrainte supplémentaire doit être ajoutée dans le problème d'optimisation, ce qui permettra à . Nous pouvons toujours ajouter plus de fonctions de base qui ne sont pas dans si nécessaire; cela aura pour effet d'ajouter un GP déterministe, par exemple à l'IRFk(x,x′) g(x,x′) ϕi(x) F Φ⊤α=0 α⊤Kα≥0 F ψ(x)⊤γ ζ(x) dans (2).
La spline en plaque mince dépend d'un entier tel que , l'espace contient des polynômes de faible degré, de dimension dépendant de et . On peut montrer que si est la fonction suivante pour puis définit un wrt conditionnellement positif . La construction concerne un opérateur différentielm m>2d F p(m) m d E(r) r≥0
Statistiques de Cressie N pour les données spatiales . Wiley 1993.
Mardia KV, Kent JT, Goodall CR et Little JA. Krigeage et splines avec informations dérivées. Biometrika (1996), 83,1, pp. 207-221.
Modèles de spline Wahba G pour les données d'observation . SIAM 1990.
Wang, Y Lissage des cannelures, méthodes et applications . Chapman et Hall, 2011.
la source