Mon problème est que je ne connais pas l'énergie du bruit de fond, donc je ne peux pas simplement limiter l'énergie. Le traitement se fait en temps réel, et j'ai environ 500 ms pour décider. Idéalement, je voudrais que les consonnes silencieuses soient considérées comme non silencieuses.
audio
speech-recognition
Michael Litvin
la source
la source
Réponses:
Il y a un tas de paramètres que vous pouvez regarder:
Je pense qu'une combinaison de ces trois devrait donner un schéma de détection assez robuste.
la source