J'essaie de m'enseigner le WHT mais il ne semble pas y avoir beaucoup de bonnes explications en ligne n'importe où. Je pense avoir compris comment calculer le WHT, mais j'essaie vraiment de comprendre pourquoi il est considéré comme utile dans le domaine de la reconnaissance d'image.
Qu'est-ce qui est si spécial et quelles propriétés cela fait-il ressortir dans un signal qui n'apparaîtrait pas sur les transformées de Fourier classiques ou d'autres transformées en ondelettes? Pourquoi est-il utile pour la reconnaissance d'objets comme indiqué ici ?
image-processing
Spacey
la source
la source
Réponses:
La NASA utilisait la transformée de Hadamard comme base pour compresser des photographies de sondes interplanétaires dans les années 60 et au début des années 70. Hadamard est un substitut de calcul plus simple pour la transformée de Fourier, car il ne nécessite aucune opération de multiplication ou de division (tous les facteurs sont plus ou moins un). Les opérations de multiplication et de division étaient extrêmement chronophages sur les petits ordinateurs utilisés à bord de ces engins spatiaux, donc les éviter était bénéfique à la fois en termes de temps de calcul et de consommation d'énergie. Mais depuis le développement d'ordinateurs plus rapides incorporant des multiplicateurs à cycle unique et la perfection d'algorithmes plus récents tels que la transformation de Fourier rapide, ainsi que le développement de JPEG, MPEG et d'autres compressions d'images, je crois que Hadamard est tombé en désuétude. cependant, Je comprends que cela pourrait être un retour pour une utilisation en informatique quantique. (L'utilisation de la NASA est tirée d'un ancien article des NASA Tech Briefs; l'attribution exacte n'est pas disponible.)
la source
Les coefficients de la transformée de Hadamard sont tous +1 ou -1. La transformation rapide de Hadamard peut donc être réduite à des opérations d'addition et de soustraction (pas de division ou de multiplication). Cela permet d'utiliser un matériel plus simple pour calculer la transformation.
Le coût ou la vitesse du matériel peut donc être l'aspect souhaitable de la transformation de Hadamard.
la source
Jetez un œil à cet article si vous y avez accès, j'ai collé le résumé ici Pratt, WK; Kane, J .; Andrews, HC; , "Hadamard transform image coding", Actes de l'IEEE, vol.57, n ° 1, pp. 58-68, janvier 1969 doi: 10.1109 / PROC.1969.6869 URL: http://ieeexplore.ieee.org/stamp /stamp.jsp?tp=&arnumber=1448799&isnumber=31116
Résumé L'introduction de l'algorithme de transformée de Fourier rapide a conduit au développement de la technique de codage d'image par transformée de Fourier par laquelle la transformée de Fourier bidimensionnelle d'une image est transmise sur un canal plutôt que sur l'image elle-même. Ce développement a en outre conduit à une technique de codage d'image similaire dans laquelle une image est transformée par un opérateur de matrice Hadamard. La matrice de Hadamard est un tableau carré de plus et moins ceux dont les lignes et les colonnes sont orthogonales les unes aux autres. Un algorithme de calcul à grande vitesse, similaire à l'algorithme de transformée de Fourier rapide, qui effectue la transformation de Hadamard a été développé. Étant donné que seuls des ajouts et des soustractions de nombres réels sont requis avec la transformée de Hadamard, un avantage de vitesse d'ordre de grandeur est possible par rapport à la transformée de Fourier en nombre complexe.
la source
J'aimerais ajouter que toute m-transform (matrice de Toeplitz générée par une m-séquence) peut être décomposée en
P1 * WHT * P2
où WHT est la transformation de Walsh Hadamard, P1 et P2 sont des permutations (réf: http://dl.acm.org/citation.cfm?id=114749 ).
m-transform est utilisé pour un certain nombre de choses: (1) identification du système lorsque le système est en proie à du bruit et (2) par virtuel de (1) identifier le retard de phase dans un système qui est en proie à du bruit
pour (1), m-transform récupère le ou les noyaux du système lorsque le stimulus est une séquence m, ce qui est utile en neurophysiologie (par exemple http://jn.physiology.org/content/99/1/367. pleine et autres) car il s'agit d'une puissance élevée pour un signal large bande.
Pour (2), le code Gold est construit à partir de séquences m (http://en.wikipedia.org/wiki/Gold_code).
la source
Je suis très heureux d'assister à un renouveau autour des transformations de Walsh-Paley-Hadamard (ou parfois appelées Waleymard), voir Comment pouvons-nous utiliser la transformation de Hadamard dans l'extraction de fonctionnalités à partir d'une image?
En tant que tels, ils peuvent être utilisés dans n'importe quelle application où des bases cosinus / sinus ou ondelettes sont utilisées, avec une mise en œuvre très bon marché. Sur les données entières, elles peuvent rester entières et permettre des transformations et une compression véritablement sans perte (de la même manière que les DCT entiers ou les ondelettes binaires ou binlet). On peut donc les utiliser dans des codes binaires.
Leur performance est souvent considérée comme plus mauvaise que d'autres transformations harmoniques sur des signaux et des images naturels, en raison de leur nature en blocs. Cependant, certaines variantes sont encore utilisées, comme pour les transformations de couleurs réversibles (RCT) ou les transformations de codage vidéo à faible complexité (transformation et quantification à faible complexité en H.264 / AVC ).
Quelques publications:
la source
Quelques liens: page Web
Description générale
Pour la distribution gaussienne
rapport
la source