L'état actuel de la technique en interpolation de signaux audio

11

Trois questions:

  1. Quelles sont toutes les mesures que l'on peut utiliser pour mesurer objectivement la qualité de l'interpolation audio? (mais aussi en termes de psychoacoustique si possible)

  2. D'après ces mesures, quel est l'état actuel de la technique en matière d'interpolation audio?

  3. Supposons que je devais rendre deux fichiers à partir d'une séquence de notes d'instruments virtuels dans deux résolutions, puis comparer un suréchantillonnage d'un fichier avec la version rendue à haute fréquence, quel logiciel pourrait-on utiliser pour les comparer objectivement? - en utilisant idéalement les métriques susmentionnées

Jusqu'à présent, d'après ce que j'ai pu rassembler, ces rééchantillonneurs offrent la meilleure qualité

  1. http://www.mega-nerd.com/SRC/
  2. http://sox.sourceforge.net/SoX/
  3. http://www.izotope.com/tech/src/

L'un des problèmes que ces rééchantillonneurs semblent avoir est le pré et le post-sonnerie.

Je dois noter que la reconstruction du signal est d'un intérêt majeur (dans la mesure où ce terme a du sens), donc plus de suréchantillonnage que de sous-échantillonnage.

Edit: L'efficacité du temps d'interpolation n'est pas pertinente dans ce contexte.

Cordialement, Les curieux :-)

Bent Rasmussen
la source

Réponses:

5

Concernant le "problème" que vous notez avec les rééchantillonneurs:

De nombreux algorithmes de rééchantillonnage utilisent un noyau d'interpolation polyphasé à filtre passe-bas à phase linéaire. Un noyau d'interpolation de filtre à phase minimale, par opposition à un noyau d'interpolation à phase linéaire (avec la même réponse en fréquence), produirait moins de pré-sonnerie pendant le rééchantillonnage à un taux d'échantillonnage plus élevé, qui peut objectivement mesurer comme moins précis, mais peut-être psycho acoustiquement "meilleur" pour les humains.

Voici une note sur la création de filtres de phase minimum pour le filtrage avec potentiellement moins de pré-sonnerie: http://www.music.columbia.edu/pipermail/music-dsp/2004-F February/ 059372.html

En outre, un filtre passe-bas conçu par Remez (Parks-McClellan) peut avoir une ondulation périodique claire dans le domaine fréquentiel, ce qui pourrait également produire une impulsion de pré-anneau dans le domaine temporel. Donc, vous voudrez peut-être plutôt essayer un Sinc fenêtré, ou une dérivation d'un filtre analogique classique, pour la conception du filtre passe-bas (ce dernier aboutissant généralement à quelque chose de plus proche de la phase minimale) pour le noyau d'interpolation de rééchantillonnage.

hotpaw2
la source
En ce qui concerne votre point sur les filtres de phase minimum: je ne suis pas sûr des deux premiers liens, mais le SRC d'iZotope permet une phase variable en continu entre minimum et linéaire. Dans les tests d'écoute, les gens ont tendance à aimer quelque part entre la phase minimale et la phase linéaire.
schnarf
Un filtre fenêtré-sinc ne serait pas nécessairement mieux qu'un filtre équiripple (conçu via l'échange Remez) en ce qui concerne la sonnerie dans le domaine temporel. L'effet de sonnerie est appelé phénomène de Gibbs et s'observe lorsque vous limitez la bande d'un signal contenant des discontinuités (par exemple une onde carrée). Elle n'est pas causée par l'ondulation du domaine fréquentiel d'un filtre équiripple. L'effet est plus visible lorsque vous utilisez des filtres à coupure très nette; l'augmentation de la largeur de transition peut l'atténuer quelque peu.
Jason R
@Jason R: sinusoïde dans le domaine temporel = impulsion dans le domaine fréquentiel, position en fonction du taux d'ondulation de la sinusoïde. Maintenant inversez les 2 domaines et mettez une ondulation de type sinusoïdal dans une réponse de domaine de fréquence. L'impulsion va dans le domaine temporel, position en fonction des caractéristiques d'ondulation.
hotpaw2
@ hotpaw2: Je vois votre analogie. J'ai mal compris l'intention de votre terme «impulsion de pré-sonnerie».
Jason R
De plus, une fenêtre lisse dans le domaine temporel reproduit sa forme non discontinue autour des discontinuités dans le domaine fréquentiel par convolution, réduisant ainsi le dépassement de Gibbs.
hotpaw2
6

Il y a cette comparaison assez approfondie des algorithmes de rééchantillonnage: http://src.infinitewave.ca/

Vous pouvez voir les tests qu'ils ont utilisés là-bas. Le crénelage est important et il est facile à visualiser avec un spectrogramme d'un balayage sinusoïdal. Il existe également une réponse en fréquence élevée - SRC peut réduire les hautes fréquences en plus de leur permettre de provoquer un alias. Vous pouvez visualiser la réponse de phase avec le graphique de réponse impulsionnelle ou avec un tracé de la réponse de phase.

schnarf
la source
Oui, je connais cette excellente ressource. Je voulais juste connaître tous les paramètres qui valent la peine d'être mesurés lors de la mesure des performances de rééchantillonnage (en particulier de suréchantillonnage).
Bent Rasmussen