Comment obtenir la parole du texte saisi en utilisant la ligne de commande?
Possibilité également de changer le débit, la hauteur, le volume, etc. à l' aide d'une simple commande .
Comment obtenir la parole du texte saisi en utilisant la ligne de commande?
Possibilité également de changer le débit, la hauteur, le volume, etc. à l' aide d'une simple commande .
Réponses:
Par ordre de popularité décroissante :
say convertit un texte en discours audible à l’aide du moteur de parole GNUstep.
festival système général de synthèse de la parole multilingue.
spd-say envoie une requête de sortie text-to-speech à un répartiteur de parole
espeak est un logiciel de synthèse vocale multilingue.
la source
spd-say
semble être pré-installé dans 14.04 et plus tard: releases.ubuntu.com/trusty/…sudo pip install gTTS
, vous pouvez également y accéder (Google Text to Speech / github.com/pndurette/gTTS ) . .gtts-cli "hello" -o hello.mp3
mpg123 -
gtts-cli "why, hello there" | mpg123 -
spd-say
ne semble pas pouvoir jouer simultanément, une seule foisespeak
/spd-say
est le meilleur pour les memes (les autres ne peuvent même pas prononcer le mot "meme" correctement). Le mieux, je peux dire,spd-say
utiliseespeak
comme base (les voix ont le même son).espeak
est un bon petit outil.J'aime juste jouer avec cela dans une ligne de commande. Vous constaterez peut-être que cela est en conflit avec Pulseaudio, alors j'utilise une version longue qui empêche de le configurer correctement.
espeak --help
vous montrera les options pour calibrer la vitesse de lecture, le ton, la voix, etc.Lorsque vous rédigez vos notes, enregistrez-les sous forme de fichier texte, puis:
Vous pouvez ensuite jouer avec ffmeg et al pour compresser le contenu du format PCM en un format plus gérable, comme le format MP3 ou OGG. Mais c'est une autre histoire.
la source
De
man spd-say
:Vous pouvez donc utiliser la synthèse vocale en suivant la commande suivante:
Ex:
Vous pouvez également définir le débit, la hauteur, le volume, etc., voir page de manuel.
la source
spd-say -t female2 "text"
rend supportableMbrola ne fonctionne plus depuis le 11.10.
Les outils SVOX (pico) sont faciles à installer, à utiliser et offrent des voix de bonne qualité dans Ubuntu. Installez-le:
Encore plus facilement, vous pouvez utiliser LibreOffice en combinaison avec les outils SVOX (pico) en installant l' extension "Read Text" et vous obtenez une "interface graphique" pour cet excellent logiciel TTS:
Configurez les options de Read Text Extension avec Tools - Add-ons - Read Selection .... Utilisez / usr / bin / python en tant que programme externe. Sélectionnez une option de ligne de commande incluant le jeton (PICO_READ_TEXT_PY).
la source
Python Google Speach:
Svox à partir d'Android:
Svox Nanotts:
Liens - Wiki:
Comparaison de synthétiseurs vocaux
la source
google_speech
sur ubuntu 18.04 je devais installerpython3-pip
etlibsox-fmt-mp3
et utiliserpip3 install google_speech
.Et encore une autre espeak IUG:
gespeaker
. Il utilise les deuxespeak
et lesmbrola
moteurs. En outre, il a plus d'options queespeak-gui
.la source
Ce qui suit n’est pas une solution FLOSS, mais vous en trouverez peut-être la peine. (c'est une solution de vin ),
Personnellement, je suis très féru de TTS, je l’utilise assez souvent ... par exemple. en écoutant un discours décousu que je ne prendrais jamais la peine de m'en tenir à une autre manière (parce que j'ai besoin de prendre une autre tasse de café ... :)
Quelques choses que j'ai découvertes en cours de route ... ou devrais-je dire, des choses que je n'ai pas découvertes en cours de route ... Pour parler franchement: chaque logiciel vocal de FOSS TTS que j'ai essayé est sous la moyenne et par conséquent inadapté à une écoute semi-prolongée ...
J'utilise actuellement NaturalVoices d'ATnT. Il n’est disponible que pour Windows (peut-être le Mac), mais il fonctionne sous
wine
Ubuntu .. (il a un glytch mineur, où j’ai parfois besoin de cliquer sur le panneau lorsque je s’éloigne du lecteur ... C’est un mineur problème par rapport à l’avantage procuré par la qualité du discours de NatualVoices.Certaines autres choses que j'ai trouvées pratiquement essentielles pour une expérience d'écoute semi-sensée sont: ...
Ces programmes TTS ne sont pas intelligents (peut-être aussi intelligents qu’un jeune babouin). Ils ont donc besoin de toute l’aide qu’ils peuvent obtenir. et il y en a un (et un seul programme de lecture que j'ai trouvé qui aide grandement à cela .. L'application s'appelle
ReadPlease (2003 Pro)
... Elle vous permettait de modifier spécialement des mots et des groupes de mots à prononcer comme vous le souhaitez ... Il n’est en aucun cas parfait, mais pour moi, cela a fait la différence entre tout le processus étant utilisable et non utilisable ...Le discours dans Natural Voices est "ok", mais c'est un peu ennuyeux. Il existe également d’autres bons produits, mais ils sont tous destinés à Windows, malheureusement) ..
Cela surprend parfois bien… mais OMG, au début, c’est pénible! .. donc # 2 est * patience ... et beaucoup de mises à jour de votre liste de "mots spéciaux" ... Par patience, je veux dire que vous vous êtes réellement habitué aux habitudes de discours de mon babouin particulier:) ... et par En passant, il y a actuellement environ 3000 mots qui sonnent suffisamment "Humain" pour ne plus me froisser lorsque je les entends.
3 .. "Suivez la balle qui rebondit" ... Encore une fois, parce que la voix n’est jamais aussi bonne que celle d’un vrai orateur, il faut parfois clarifier les choses. Le programme Reader que j'utilise a une fonctionnalité pour laquelle je mets même en place avec son interface d'apparence maladroite .... Il a une option de mot "sélection de la lecture en cours" .. De nombreux lecteurs l'ont, mais ReadPlease continue d'activer la ligne actuelle centre de l’écran. C’est précieux pour pouvoir voir devant et derrière et relire rapidement ce que vous venez de manquer (le centrage automatique de la ligne courante est donc bon) ...
Eh bien, c’est mon expérience… je vais faire un café maintenant, et pendant que je le fais, je l’écouterai pour voir comment il se «lit»… .TTS est étonnamment bon à ramasser fautes de frappe (je fais beaucoup de fautes de frappe) ...
Si quelque chose d'aussi bon que ATnT NaturalVoices se présente sur le référentiel Ubuntu, je vais sauter à autre chose.
Voici un lien vers des exemples de Natural Voices : J'utilise "MIke"
la source
SVOX pico2wave
C'est ce que j'utilise. Et ça a l'air naturel, c'est facile à comprendre, ça reconnaît les Unités (m, ° C, kg, ...)
Voici mon premier post sur pico2wave
Texte naturel à la parole?
Tout ce que tu dois faire est:
Accédez au Centre de logiciel Ubuntu et recherchez "pico". Vous trouverez 4 ou 5 entrées avec "Small Footprint Ling ...". Installez-les.
Une utilisation possible de pico2wave est décrite dans ma première publication (suivez le lien ci-dessus).
Au revoir
la source
Pour
festival
(la voix me semble plus naturelle):sudo apt-get install festival
echo "hello" | festival --tts
Configuration du pitch et de la vitesse:
créer
~/.festivalrc
:(Parameter.set 'Audio_Command "play -b 16 -c 1 -e signed-integer -r $SR -t raw $FILE tempo 1.5 pitch -100") (Parameter.set 'Audio_Method 'Audio_Command)
Voir aussi http://www.solomonson.com/content/ubuntu-linux-text-speech
Mise à jour: essayé sur un autre ordinateur Ubuntu. Il a fallu installer le moteur de parole anglais pour fonctionner correctement avec festival:
sudo apt-get install festvox-kallpc16k
Est également
play
une commande cli qui vient avec lesox
paquet:sudo apt-get install sox
la source
Même si vous avez déjà accepté une réponse, je voulais mentionner
festival
, ce que j'aime beaucoup aussi. Cet article sur les forums Ubuntu contient beaucoup d’informations sur la manière de mettre en place de très belles voix.la source
Meet
espeak-ng
- Un logiciel de synthèse vocale multilingue:Il utilise une voix anglaise par défaut, mais il existe de nombreuses autres voix pour d'autres langues et même des dialectes disponibles et peut être répertoriée avec
espeak-ng --voices
(pour tous) ou par exempleespeak-ng --voices=en
(pour l'anglais). Ils peuvent être définis avec-v
l’abréviation de la langue ou le nom du fichier, par exemple pour l’écossais ou le swahili:Il existe de nombreuses autres options disponibles, par exemple
-s
pour la vitesse et-w
pour écrire la sortie dans un fichier wave, voir la page de manuel liée ci-dessous.Lectures complémentaires
man espeak-ng
espeak-ng
(“Ng” pour “next generation”) est une branche développée duespeak
logiciel de synthèse vocale original , voir le chapitre Historique sur Wikipedia . Les deux sont disponibles auprès des sources officielles via le packageespeak
ouespeak-ng
respectivement.la source
Balabolka sous Wine fonctionne bien (pour moi) avec les voix SAPI4 (les voix SAPI5 ne sont pas détectées sur mon système Linux). Il peut ouvrir des fichiers et commencer à lire.
Voici le lien vers l'entrée AppDB de wine pour Balabolka: https://appdb.winehq.org/objectManager.php?sClass=application&iId=17859
la source
L'outil gTTS est idéal pour générer des fichiers audio à partir de texte. Il utilise l'API de synthèse vocale de Google Traduction et génère des fichiers MP3.
Etant donné qu’il utilise
pip
pour l’installation, je vous recommande fortement d’installer Miniconda, puisconda
de le créer pour créer un environnement dans lequel vous pourrez installer gTTS. Vous pouvez télécharger Miniconda à partir d'ici:https://docs.conda.io/en/latest/miniconda.html
Le référentiel GitHub pour gTTS est:
https://github.com/pndurette/gTTS
Et vous pouvez trouver la documentation de gTTS ici:
https://gtts.readthedocs.io/en/latest/
la source