Pour les valeurs complexes, pourquoi utiliser un conjugué complexe en convolution?

8

Extrait de Adaptive Filter Theory (2014) écrit par Haykin page 110:

y(n)=k=0wku(nk),n=0,1,2,...

uet sont des valeurs complexes. Ma question est pourquoi utiliser un conjugué complexe de ? La réponse trouvée dans le livre dit "..., dans une terminologie complexe, le terme représente la version scalaire d'un produit interne du coefficient de filtre et de l'entrée de filtre " . Je ne comprends toujours pas, pouvez-vous élaborer sur cette réponse?wwkwku(nk)wku(nk)

Ηλεκτρολόγος Μηχανικός
la source

Réponses:

10

Il s'avère que la convolution et la corrélation sont étroitement liées. Pour les signaux réels (et les signaux à énergie finie):

Convolution: y[n]h[n]X[n]=m=-h[n-m]X[m]

Corrélation:RyX[n]m=-y[n+m]X[m]=y[-n]X[m]

Maintenant, dans les espaces métriques, nous aimons utiliser cette notation:

RXy[n]X[m],y[n+m]=m=-X[m]y[n+m]

Le est le produit intérieur des vecteurs et où et . Ensuite, nous aimons également définir la norme d'un vecteur commeX,yXyX={X[n]}y={y[n]}

XX,X=m=-X[m]X[m]=m=-X2[m]

et cela ressemble beaucoup à la longueur euclidienne d'un vecteur avec un nombre infini de dimensions. Tout cela fonctionne très bien dans le cas où les éléments du vecteur sont tous réels. La normeest toujours réel et non négatif.X[n]XX

Donc, si nous généralisons et permettons aux éléments de d'avoir une valeur complexe, alors si la même définition de norme doit être utilisée,X

XX,X

alors la définition du produit intérieur doit être légèrement modifiée:

X,y=m=-X[m]y[m]

Alors si a des éléments à valeurs complexes, la norme se présente comme suit:X

XX,X=m=-X[m]X[m]=m=-|X[m]|2

Donc, évidemment, Haykin est juste en train de ramener cette définition de produit intérieur à la définition de convolution.

robert bristow-johnson
la source
4

L'utilisation du conjugué dans la formation du filtre adaptatif n'est pas nécessaire. Cependant, si vous n'écrivez pas la sortie à l'aide d'un conjugué, il est assez facile d'oublier que les variables que vous traitez sont complexes. Si vous écrivez alors il n'est pas clair que vous avez affaire à des quantités complexes.

h(n)=k=0wk(n)u(n-k)

Comme Robert l'a déjà souligné, la définition de la corrélation doit être mise à jour pour gérer des données complexes si vous avez l'habitude de la voir définie uniquement pour des données réelles.

Une autre raison d'utiliser le conjugué comme celui-ci, est de simplifier la prise de dérivés pour trouver la solution au filtre adaptatif. Supposons que nous ayons une fonction objective à valeur réelle que nous essayons de minimiser - il s'agit généralement de l'erreur quadratique moyenne, c'est-à-dire . Prendre la dérivée de cette quantité par rapport à n'est pas si simple.J(w)E[e(n)e(n)]w

La technique courante consiste à écrire la fonction objectif en fonction de et - c'est-à-dire de traiter et comme des variables indépendantes. Maintenant, nous avons wwww

J(w)=F(w,w)

Pour trouver le minimum, nous prenons les dérivées wrt et et les mettons à zéro, nous souhaitons donc résoudre ww

F(w,w)w=F(w,w)w=0

Cependant, si vous faites l'analyse, vous constaterez que

F(w,w)w=0F(w,w)w=0

Il vous suffit donc de résoudre l'une de ces équations.

Pour plus de détails, vous pouvez consulter:

  • "Un opérateur de gradient complexe et son application dans la théorie des réseaux adaptatifs", Brandwood 1983, Communications, Radar and Signal Processing, IEE Proceedings F
  • "L'opérateur de gradient complexe et le calcul CR" Kreutz-Delgado ici
  • "Complex gradient and Hessian", van den Bos, 1994, Vision, Image and Signal Processing, IEE Proceedings

Pour la théorie des filtres adaptatifs, je préfère de beaucoup la présentation dans "Fundamentals of Adaptive Filtering" par Ali Sayed. Il présente une dérivation unifiée des filtres LMS, NLMS, RLS, APA et Lattice.

David
la source