Merci pour la référence! Vous avez oublié de mentionner votre travail sur l' amélioration de la batterie , qui peut également être intéressante pour l'application Summer_More_More_Tea. Eh bien, tout dépend vraiment de ce que vous voulez en faire. Avez-vous une "application finale" en tête?
Je suis entièrement d'accord avec les déclarations ci-dessus de pichenettes. Pour être complet, je dois cependant dire que l'amélioration vocale que vous avez mentionnée a également été utilisée dans certaines œuvres de Matti Ryynänen, sur la génération de pistes de karaoké, pour améliorer les résultats.
Pour répondre à vos questions:
Compte tenu de l'efficacité, laquelle est préférée (ou toute autre solution :)?
Comme le disent les pichenettes, ni l'un ni l'autre ne semble répondre à votre besoin: le filtrage passe-bas / passe-haut est voué à l'échec en raison de la structure harmonique de la voix humaine (et plus généralement de tout son "intéressant" - c'est-à-dire au-delà des sinusoïdes ... ).
Si le 2ème, laissez deux canaux A et B, (BA) ou (AB) seront-ils utilisés lors du calcul de l'arrière-plan? Comme pour la fusion de deux canaux, la moyenne arithmétique est-elle suffisamment précise?
Encore une fois, la deuxième méthode que vous mentionnez ne fonctionnera pas car vous ne pouvez supprimer que le signal qui est au centre, pas le récupérer. En d'autres termes, même les voix sont au "centre", il n'y a pas de calcul simple pour obtenir un signal uniquement vocal.
Ou puis-je sous-échantillonner chaque canal par un facteur de deux et entrelacer les signaux sous-échantillonnés comme résultat mono?
euh ... la moyenne des canaux pour obtenir un signal mono-canal, comme suggéré ci-dessus, a du sens et ne cassera pas les caractéristiques spectrales de votre signal (en supposant que le signal stéréo ne soit pas dégénéré). Vous obtenez donc un signal mono dans lequel vous avez, fondamentalement, le même contenu musical qu'auparavant.
Un sous-échantillonnage correct de chaque canal signifie que vous appliquez d'abord un filtre passe-bas (avec une fréquence de coupure de sampling_rate / 4 dans votre cas), puis vous pouvez prendre en toute sécurité tous les 2 échantillons. Il n'y a cependant pas grand-chose à dire sur l'entrelacement des canaux ainsi sous-échantillonnés: dans la plupart des cas généraux, cela rompt les caractéristiques spectrales de votre signal. Vous ne voulez probablement pas cela.
En effet, l'opération de filtrage passe-bas suivie de la mise à 0 tous les 2 échantillons, et le maintien de ces 0 conduit, dans le domaine de Fourier, à "mettre en miroir" les composantes basse fréquence qui ont été conservées sur celles haute fréquence. Rappelez-vous que vous apprenez les cours de traitement du signal sur la théorie de l'échantillonnage: la multiplication par une séquence d'impulsions (ou diracs) entraîne une convolution avec une autre séquence de diracs dans le domaine de Fourier, c'est-à-dire que dans ce cas, le spectre de fréquence du signal est répété (périodisé) le long de l'axe des fréquences, avec une période égale à la fréquence d'échantillonnage.
Normalement, lors du sous-échantillonnage, vous supprimez les 0 (car vous supposez une nouvelle fréquence d'échantillonnage). Mais ici, les conserver entraîne des composants haute fréquence supplémentaires très ennuyeux. L'entrelacement de ces signaux ne va pas corriger cela.
Eh bien, dans l'ensemble, la réponse courte: ne faites pas cela . :-)
Enfin, je pourrais également vous suggérer d'utiliser l'interface graphique que j'ai développée pour la conférence LVAICA 2012: il y a un dépôt git pour cela. Je suis toujours en train de le déboguer et de l'améliorer, donc les commentaires sont les bienvenus: D
J'espère que cela pourra aider!