Pouvez-vous représenter un signal audio dans d'autres domaines que le temps et la fréquence?
8
Peut-être une question stupide, mais s'il y a une représentation dans le domaine temporel du signal audio, et aussi dans le domaine fréquentiel, alors y a-t-il un autre domaine dans lequel le signal peut être représenté?
Cepstrum est très utile pour certaines applications.
Serge
Réponses:
8
L'audio n'existe vraiment que dans le domaine temporel, en audio, nous le traduisons en somme d'ondes sinusoïdales car cela est lié à la façon dont nous entendons les sons. Il existe d'autres façons d'interpréter les sons, tout dépend si cette représentation vous est utile. Les choses que vous pourriez trouver intéressantes sont les ondelettes, les synthèses granulaires, les synthèses de formants, je me souviens avoir lu quelque chose qui fonctionne en représentant le son une sorte de synthèse granulaire où chaque granule était fait de la série harmonique naturelle, je pense que cela s'appelait la synthèse résonante.
Fondamentalement, il s'agit de décomposer les informations en plusieurs «bits». Le signal audio réel est une «valeur» variant dans le temps, mais il est souvent utile de le considérer sous une forme différente. Par analogie, considérez le nombre 256: selon ce que vous faites avec vos numéros, il peut être utile de traiter le nombre comme 200 + 50 + 6, ou 16 + 240, ou 16*16, ou peut-être comme 2^8; il existe un nombre infini de façons de traiter le nombre, et celui que vous utilisez dépend de ce que vous essayez d'atteindre.
La «représentation du domaine fréquentiel» est un exemple de la décomposition ci-dessus, mais avec un signal plutôt qu'un nombre. Dans ce cas, vous représentez le signal d'origine comme une somme de sinusoïdes, toutes avec des fréquences, des amplitudes et des phases différentes. Si vous les ajoutez tous ensemble, vous récupérez votre signal d'origine. Vous pouvez également choisir de le représenter d'une manière différente, comme avec des ondelettes, ou toute autre approche qui peut ou non avoir un nom (encore), si cela est utile pour ce que vous lui faites. Peut-être pourriez-vous le diviser en morceaux de 3 secondes, puis réorganiser le signal dans chacun de ces morceaux pour augmenter de manière monotone, et vous rappeler comment vous les avez réorganisés. Cela semble un peu ridicule, mais il existe une approche pour manipuler les images IRM avec ce type de réorganisation (il n'utilise pas la partie de segmentation,
Un avantage des sinusoïdes est que, comme le dit Nathan Day, cela se rapporte à la façon dont nos oreilles interprètent la hauteur des sons. Mais une raison plus importante est que les sinusoïdes sont des exponentielles complexes, qui sont des fonctions propres des systèmes linéaires; c'est-à-dire que les systèmes linéaires sont beaucoup plus simples à analyser si l'on considère les entrées et sorties comme des sommes de sinusoïdes. C'est la raison principale pour laquelle l'analyse de Fourier est si répandue et importante.
Réponse courte à votre question: il existe un nombre infini de domaines dans lesquels vous pouvez représenter un signal audio. Pour un autre populaire, voir ondelettes.
Réponses:
L'audio n'existe vraiment que dans le domaine temporel, en audio, nous le traduisons en somme d'ondes sinusoïdales car cela est lié à la façon dont nous entendons les sons. Il existe d'autres façons d'interpréter les sons, tout dépend si cette représentation vous est utile. Les choses que vous pourriez trouver intéressantes sont les ondelettes, les synthèses granulaires, les synthèses de formants, je me souviens avoir lu quelque chose qui fonctionne en représentant le son une sorte de synthèse granulaire où chaque granule était fait de la série harmonique naturelle, je pense que cela s'appelait la synthèse résonante.
la source
Fondamentalement, il s'agit de décomposer les informations en plusieurs «bits». Le signal audio réel est une «valeur» variant dans le temps, mais il est souvent utile de le considérer sous une forme différente. Par analogie, considérez le nombre
256
: selon ce que vous faites avec vos numéros, il peut être utile de traiter le nombre comme200 + 50 + 6
, ou16 + 240
, ou16*16
, ou peut-être comme2^8
; il existe un nombre infini de façons de traiter le nombre, et celui que vous utilisez dépend de ce que vous essayez d'atteindre.La «représentation du domaine fréquentiel» est un exemple de la décomposition ci-dessus, mais avec un signal plutôt qu'un nombre. Dans ce cas, vous représentez le signal d'origine comme une somme de sinusoïdes, toutes avec des fréquences, des amplitudes et des phases différentes. Si vous les ajoutez tous ensemble, vous récupérez votre signal d'origine. Vous pouvez également choisir de le représenter d'une manière différente, comme avec des ondelettes, ou toute autre approche qui peut ou non avoir un nom (encore), si cela est utile pour ce que vous lui faites. Peut-être pourriez-vous le diviser en morceaux de 3 secondes, puis réorganiser le signal dans chacun de ces morceaux pour augmenter de manière monotone, et vous rappeler comment vous les avez réorganisés. Cela semble un peu ridicule, mais il existe une approche pour manipuler les images IRM avec ce type de réorganisation (il n'utilise pas la partie de segmentation,
Un avantage des sinusoïdes est que, comme le dit Nathan Day, cela se rapporte à la façon dont nos oreilles interprètent la hauteur des sons. Mais une raison plus importante est que les sinusoïdes sont des exponentielles complexes, qui sont des fonctions propres des systèmes linéaires; c'est-à-dire que les systèmes linéaires sont beaucoup plus simples à analyser si l'on considère les entrées et sorties comme des sommes de sinusoïdes. C'est la raison principale pour laquelle l'analyse de Fourier est si répandue et importante.
Réponse courte à votre question: il existe un nombre infini de domaines dans lesquels vous pouvez représenter un signal audio. Pour un autre populaire, voir ondelettes.
la source