La régression de crête peut être exprimée par où est l'étiquette prédite , la matrice d'identification , l'objet pour lequel nous essayons de trouver une étiquette, et la matrice de objets tel que: Y IddxdxXnxdnxi=(xi,1,...,Xi,j)∈Rd
Nous pouvons noyauer ceci comme suit:
où est la matrice des fonctions du noyau n×nK
et le vecteur colonne des fonctions du noyau
Des questions:
(a) s'il y a plus d'objets que de dimensions, est-il judicieux de ne pas utiliser de noyaux? Par exemple, laissez être une matrice de puis sera une et nous finirons par inverser une matrice de au lieu du matrice que nous aurions à inverser si nous utilisions des noyaux. Est-ce à dire que si nous ne devrions pas utiliser de noyaux?X 50×3 X ′ X 3×33×350×50d≤n
(b) faut-il utiliser le noyau le plus simple possible? Il semble que les noyaux en régression de crête soient utilisés pour annuler les influences de la dimensionnalité et non pour utiliser certaines propriétés de l'espace des fonctionnalités (contrairement aux machines à vecteurs de support). Bien que les noyaux puissent changer les distances entre les objets, y a-t-il des noyaux populaires souvent utilisés dans la régression des crêtes?
(c) quelle est la complexité en temps de la régression des crêtes et / ou de la régression des crêtes du noyau?
Réponses:
(a) Le but de l'utilisation d'un noyau est de résoudre un problème de régression non linéaire dans ce cas. Un bon noyau vous permettra de résoudre des problèmes dans un espace d'entités éventuellement de dimension infinie. Mais, utiliser un noyau linéaire et faire la régression de la crête du noyau dans le double espace revient à résoudre le problème dans l'espace primitif, c'est-à-dire qu'il n'apporte aucun avantage (c'est juste beaucoup plus lent que le nombre d'échantillons augmente que vous avez observé).K( x , y ) = x⊤y
(b) L'un des choix les plus populaires est le noyau exponentiel carréK( x , y) = exp( - τ2|| x - y | |2)
Références:
la source