Je cherche un logiciel de synthèse de la parole facile à installer pour Ubuntu qui semble naturel. J'ai installé Festival
, Gespeaker
etc., mais rien ne sonne très naturel. Tous très synthétiques et difficiles à comprendre.
Des recommandations là-bas?
software-recommendation
text-to-speech
Je coeur Ubuntu
la source
la source
Réponses:
SVOX pico2wave
Un TTS très minimaliste, un meilleur son que espeak ou mbrola (à mon avis). Quelques informations ici .
Je ne comprends pas pourquoi pico2wave est, par rapport à espeak ou mbrola, rarement discuté. C'est petit, mais ça sonne vraiment bien (naturel). Sans modification, vous entendrez une voix féminine au son naturel.
ET ... comparé à Mbrola, il reconnaît les unités et le parle correctement!
Par exemple:
Après l'installation, je l'utilise dans un script:
Puis lancez-le avec le texte souhaité:
ou lisez le contenu d'un fichier entier:
C'est tout pour avoir un TTS stable et léger sous Ubuntu.
la source
pico2wave
est dans le paquetlibttspico-utils
dans les versions récentes d'ubuntu. @ CarlosEugenioThompsonPinzóncat <filename> | xargs -I foo -0 pico2wave -w blah.wav foo
pico2wave -w a.wav "$(input.txt)"
=). Convenez que cette interface CLI est de mauvaise conception: contrairement à la très grande majorité des CLI et il est possible d’atteindre la longueur d’argument de la CLI OS max .echo {1..1000}
Dis le!
Je crois que j'ai trouvé le meilleur logiciel TTS gratuitement en utilisant une extension Google Chrome appelée "SpeakIt". Cela ne fonctionne que dans le navigateur Chrome pour moi sur Ubuntu. Cela ne fonctionne pas avec le chrome pour une raison quelconque. SpeakIt est livré avec deux voix féminines qui paraissent toutes les deux très réalistes par rapport à tout le reste. Il existe au moins quatre autres voix masculines et féminines répertoriées dans les extensions Chrome si vous effectuez une recherche dans le Chrome Web Store en utilisant "TTS" comme requête.
Utilisation : Pour une utilisation sur un site Web. vous mettez en surbrillance le texte que vous voulez lire, puis cliquez avec le bouton droit de la souris sur "SpeakIt" ou cliquez sur l'icône SpeakIt ancrée dans la barre supérieure de Chrome.
Les utilisateurs de Firefox ont également deux options. Dans les addons de Firefox, faites une recherche sur TTS et vous devriez trouver "Cliquez sur Parler" ainsi que "Texte à la voix". Les voix ne sont pas aussi bonnes que celles de Chrome SpeakIt, mais elles sont définitivement utilisables.
L’extension SpeakIt utilise la technologie iSpeech et pour un prix de 20 USD par an, le site peut convertir du texte en fichiers audio MP3. Vous pouvez entrer du texte, des URL, des flux RSS, ainsi que des documents tels que TXT, DOC et PDF, et les exporter au format MP3. Vous pouvez créer un podcast, intégrer de l'audio, etc. Voici un lien et un échantillon de l'audio (ne sais pas combien de temps le lien durera).
la source
Pico et espeak sont amusants et faciles à utiliser, mais ils ne sont pas très bons. Les voix par défaut du Festival ne sont pas très bonnes non plus. Cependant, Festival est un cadre de parole basé sur un schéma, dans lequel un certain nombre de chercheurs ont construit de bien meilleures voix plug-in. Vous pouvez facilement surpasser la qualité pico2wave d'Ubuntu d'origine, car l'une de ces voix est disponible sous forme de package clé en main.
Pour rendre le festival naturel, voici ce qu'il faut faire:
Vous pouvez le faire depuis la ligne de commande en utilisant
-b
(ou--batch
) et en mettant chaque commande entre guillemets simples:Vous pouvez obtenir d’autres voix assez bonnes à partir du référentiel Nitech, mais leur installation est fastidieuse et les chemins par défaut ont été modifiés. Il peut donc être nécessaire de modifier manuellement les références de nom de fichier dans les fichiers de schéma fournis pour pouvoir fonctionner avec Ubuntu.
la source
Simple Google ™ TTS
Mise à jour à partir de la page du projet (2019-02) : Ce projet n'est pas maintenu et le restera dans un avenir prévisible.
En l'absence de meilleure alternative, j'ai écrit un script bash qui s'interface avec un script perl de Michal Fapso afin de fournir des informations TTS via Google Translate. De la description du projet:
Les principales caractéristiques sont:
L'installation et l'utilisation sont documentées sur la page du projet .
Je serais heureux si vous essayiez. Les rapports de bugs et tout autre commentaire sont les bienvenus!
la source
J'ai cherché haut et bas un texte de synthèse vocale pour Ubuntu de grande qualité. Il n'y en a pas. Mes cordes vocales sont paralysées, il fallait donc que TTS ajoute des instructions vocales à mes vidéos Ubuntu . Vous pouvez obtenir un logiciel de synthèse vocale Linux de haute qualité ici . C'est vraiment très cher. J'ai fini par acheter Natural Reader pour Windows (ne fonctionne pas sous Ubuntu sous Wine) pour 40 $. Peut-être que plus tard, j'aurai celui de Linux.
la source
Je mène des recherches sur les voix au texte qui sonnent le mieux et qui s’accordent le mieux. Vous trouverez ci-dessous une liste de ce que je pensais être le top 5 des produits par ordre de qualité sonore. La plupart des sites Web associés à ces produits ont une démo interactive qui vous permettra de prendre votre propre décision.
la source
Je trouve que les voix de Nitech HTS au festival sont très naturelles et réconfortantes par rapport aux autres voix que j'ai entendues. Voir ce lien pour savoir comment configurer Nitech et d’autres sons avec festival. Je n'ai pas trouvé de bon gui que je puisse utiliser pour configurer ces voix mais les régler via festival.scm fonctionne toujours. Ce message est très ancien et vous voudrez peut-être trouver le répertoire d'installation à l'aide de la commande "localiser le festival"
la source
Combinez les outils SVOX (pico) avec LibreOffice:
Les outils SVOX (pico) sont faciles à installer et apportent des voix de bonne qualité dans Ubuntu. Installez-le:
Vous pouvez utiliser LibreOffice en combinaison avec les outils SVOX (pico) en installant l' extension "Read Text" et vous obtenez une "interface graphique" pour cet excellent logiciel TTS:
Configurez les options de Read Text Extension avec Outils - Modules - Sélection de lecture .... Utilisez / usr / bin / python en tant que programme externe. Sélectionnez une option de ligne de commande incluant le jeton (PICO_READ_TEXT_PY) . Vous voudrez peut-être en expérimenter certaines.
Il ne vous reste plus qu'à sélectionner du texte dans LO Writer, Calc, Impress ou Draw et à cliquer sur l'icône ajoutée sous forme de barre d'outils (un visage heureux avec un ballon).
la source
Voici ce que j'ai fait pour avoir un discours purement naturel pour les fichiers PDF et autres fichiers texte (les autres solutions ne sont pas naturelles ou ce sont juste des services payants). C’est en fait un moyen de contourner le chrome ou le chrome, mais cela fonctionne rapidement et facilement.
Il existe également des moyens d'ouvrir d'autres fichiers tels que .doc et .txt dans chrome et de faire de même. Il existe d'autres extensions pour Chrome qui affichent les fichiers pdf. Vérifiez si cela vous convient mieux. De plus, vous pouvez télécharger tous types de textes dans Google Drive et utiliser SpeakIt! le lire pour vous. Une autre extension appelée 'Speak text' fonctionne de la même manière et a un langage naturel.
la source
En cherchant un meilleur moteur tts à utiliser avec le nouveau mode narratif firefox 49, j'ai trouvé pico tts (svox) - mon moteur TTS préféré.
Comment changer le système de moteur de synthèse vocale par défaut?
Les gens de arch linux m'ont amené sur le droit chemin:
Décommentez le module que vous aimez et faites-le par défaut dans les paramètres du répartiteur de parole:
Redémarrez le démon:
MAIS, lors du redémarrage de Firefox, rien ne se passe. Selon le lien ci-dessus (arch forum post # 10 et 16) fonctionne avec festival (n’a pas essayé), mais le répartiteur de parole de pico ne répertorie pas les voix disponibles. Ça ne courra pas.
Toute idée serait très appréciée ;-)
la source
Mon programme de synthèse vocale préféré s'appelle Magic English, mais comme Natural Reader mentionné par Joe Steiger, il s'agit d'un programme Windows et je ne sais pas s'il fonctionnera sous Wine.
AT & T Natural Voices est disponible en ligne sous forme de démo, mais c'est plus une solution de contournement qu'une solution ...
la source
Simple Google ™ TTS
Pico, mbrola, cmu, festival, flite, tous SUCK en 2017 (Ils étaient incroyables dans les années 90). Le discours naturel d'AT & T (ce qui est fantastique) n'est pas Linux compat et n'est pas gratuit, nous utilisons donc Google
la source
GTS
Inconvénients : CLI uniquement. Vous devez être en ligne, car cela nécessite de demander à Google public endpoint ouvert.
Usage
Documentation et autres exemples
Autres
Certains ont déjà été mentionnés
Mimic . Installation:
eSpeak + Gespeaker (GUI) ( code source de Gespeaker )
Inconvénients : vieux et moche
la source
Pour cela, je crée Intelligent Speaker - extension pour Google Chrome. Il peut lire des pages même sans sélection (lorsque la rétention de texte est correcte).
la source