La transformée de Fourier est couramment utilisée pour l'analyse fréquentielle des sons. Cependant, il présente certains inconvénients lorsqu'il s'agit d'analyser la perception humaine du son. Par exemple, ses cellules de fréquence sont linéaires, tandis que l'oreille humaine répond à la fréquence de façon logarithmique, et non linéaire .
Les transformées en ondelettes peuvent modifier la résolution pour différentes gammes de fréquences , contrairement à la transformée de Fourier. Les propriétés de la transformée en ondelettes permettent de grands supports temporels pour les basses fréquences tout en conservant de courtes largeurs temporelles pour les fréquences plus élevées.
L' ondelette de Morlet est étroitement liée à la perception humaine de l'audition. Il peut être appliqué à la transcription musicale et produit des résultats très précis qui ne sont pas possibles en utilisant des techniques de transformation de Fourier. Il est capable de capturer de courtes rafales de notes de musique répétitives et alternées avec une heure de début et de fin claire pour chaque note.
La transformée en Q constant (étroitement liée à la transformée en ondelettes de Morlet) est également bien adaptée aux données musicales . Comme la sortie de la transformée est effectivement amplitude / phase par rapport à la fréquence logarithmique, moins de cellules spectrales sont nécessaires pour couvrir efficacement une plage donnée, et cela s'avère utile lorsque les fréquences s'étendent sur plusieurs octaves.
La transformée présente une réduction de la résolution en fréquence avec des bacs de fréquence plus élevée, ce qui est souhaitable pour les applications auditives. Il reflète le système auditif humain, ce qui améliore la résolution spectrale aux basses fréquences, tandis que la résolution temporelle s'améliore aux fréquences plus élevées.
Ma question est la suivante: existe-t-il d'autres transformations qui imitent étroitement le système auditif humain? Quelqu'un a-t-il tenté de concevoir une transformation qui corresponde le plus possible anatomiquement / neurologiquement au système auditif humain?
Par exemple, il est connu que les oreilles humaines ont une réponse logarithmique à l'intensité sonore . Il est également connu que les contours de l'intensité sonore varient non seulement avec l'intensité, mais avec l'espacement en fréquence des composantes spectrales . Les sons contenant des composantes spectrales dans de nombreuses bandes critiques sont perçus comme plus forts même si la pression acoustique totale reste constante.
Enfin, l'oreille humaine a une résolution temporelle limitée en fonction de la fréquence . Peut-être pourrait-on également en tenir compte.
Réponses:
Lors de la conception de telles transformations, il faut tenir compte des intérêts concurrents:
Deux conceptions récentes ont récemment attiré mon attention: Transformation en ondelettes de Gammatone à motivation auditive , Traitement du signal, 2014
La transformée ERBlet: une représentation temps-fréquence auditive avec une reconstruction parfaite , ICASSP 2013
Et je mentionnerai également:
Une transformation auditive pour le traitement du signal audio , WASPAA 2009
la source