Processus gaussien: propriétés d'approximation de fonction

16

J'apprends le processus gaussien et n'ai entendu que des morceaux. J'apprécierais vraiment les commentaires et les réponses.

Pour tout ensemble de données, est-il vrai qu'une approximation de la fonction du processus gaussien donnerait une erreur d'ajustement nulle ou négligeable aux points de données? Dans un autre endroit, j'ai également entendu dire que le processus gaussien est particulièrement bon pour les données bruyantes. Cela semble être en conflit avec la faible erreur d'ajustement pour toutes les données observées?

De plus, plus loin des points de données, il semble y avoir plus d'incertitude (covariance plus importante). Si oui, se comporte-t-il comme des modèles locaux (RBF, etc.)?

Enfin, existe-t-il une propriété d'approximation universelle?

Oalah
la source

Réponses:

17

Supposons que l'échantillon de données soit . Supposons également que nous ayons une fonction de covariance k ( x 1 , x 2 ) et une moyenne nulle spécifiée pour un processus gussien. La distribution d'un nouveau point x sera gaussienne avec une moyenne m ( x ) = k K - 1 y=(X,y)={Xje,yje=y(Xje)}je=1Nk(X1,X2)X

m(X)=kK-1y
et la variance Le vecteur k = { k ( x , x 1 ) , , k ( x , x N ) } est un vecteur de covariances, la matrice K = { k ( x i , x j ) } N i
V(X)=k(X,X)-kK-1kT.
k={k(X,X1),,k(X,XN)} est une matrice de covariances d'échantillon. Dans le cas où nous faisons une prédiction en utilisant la valeur moyenne de la distribution postérieure pour lespropriétés de l'interpolation d'échantillon. Vraiment, m(X)=KK-1y=y. Mais ce n'est pas le cas si nous utilisons la régularisation, c'est-à-dire incorporons le terme de bruit blanc. dans ce cas, la matrice de covariance pour l'échantillon a la formeK+σI, mais pour les covariances avec des valeurs de fonction réelles, nous avons la matrice de covarianceK, et la moyenne postérieure est m(X)=KK={k(Xje,Xj)}je,j=1N
m(X)=KK-1y=y.
K+σjeK
m(X)=K(K+σje)-1yy.

σσ=0σ

kO(n)n

Alexey Zaytsev
la source