Je recherche un programme indépendant du locuteur (commercial ou gratuit) qui me permettrait de transcrire des fichiers MP3 contenant des enregistrements vocaux (en particulier des podcasts) en texte. Je voulais essayer Dragon Naturally Speaking, mais il semble qu'il ne prend en charge que la transcription de mes propres enregistrements vocaux. Alors quelles sont les alternatives?
16
Réponses:
Dragon Naturally Speaking importera des fichiers mp3 et essaiera de les transcrire. Il préfère régler sa reconnaissance vocale sur le haut-parleur individuel, mais fait un bon travail sans réglage. Cela fonctionnerait probablement mieux si vos haut-parleurs de podcast sonnaient comme Tom Brokaw.
la source
Une solution possible serait de télécharger votre vidéo sur Youtube et d'essayer les sous-titres automatiques que vous pouvez activer ... ce n'est pas encore trop précis, mais vous pouvez télécharger le fichier de sous-titres et le modifier vous-même, si cela vous aide ... comme pour les problèmes de droits d'auteur / piratage de la chanson, vous pouvez rendre la vidéo privée sur votre profil, si c'est possible?
la source
Je vous déconseille d'essayer Dragon Naturally Speaking - J'ai écrit quelques scripts sur mon iPhone jailbreaké pour copier / convertir tous les fichiers de messagerie vocale de mon téléphone vers un dossier sur mon PC et j'ai fait exécuter le service de transcription Dragon Naturally Speaking contre eux.
Le résultat de l'exécution de la transcription sur des fichiers avec différents haut-parleurs était absolument inutilisable. J'ai essayé certaines des alternatives open source mais la reconnaissance vocale indépendante du locuteur semble toujours limitée à de très petits dictionnaires.
la source
J'utilise http://www.voicebase.com avec des podcasts et des vidéos en anglais et cela fonctionne très bien. C'est gratuit pendant 50 heures audio.
Vous pouvez télécharger la transcription audio sur rtf, srt ou pdf.
Vous pouvez télécharger les transcriptions des machines environ 10 à 15 minutes après le téléchargement, et parfois tôt.
la source
Open Source: CMU Sphinx
Shareware: http://www.e-speaking.com/ (Windows)
Commercial: Dragon NaturallySpeaking (Windows)
Vous pouvez également essayer cette méthode si vous essayez avec osx, ce qui peut être fait en utilisant l'audace et le soundflower
Vous pouvez également trouver des liens pertinents pour opensource, un autre shareware à essayer était voxcribecc
Si vous êtes un programmeur .net, vous pouvez utiliser cette méthode pour créer votre propre kit
la source
Podzinger serait une excellente solution, mais je ne suis pas sûr que la rampe (le nouveau nom de la société qui était EveryZing, qui a produit Podzinger) offre le service gratuitement ...
http://en.wikipedia.org/wiki/Podzinger
la source