Comment puis-je changer la prononciation d'Alexa d'un mot spécifique dans une compétence?

8

Parfois, lors du développement d'une compétence Alexa et de la programmation des réponses de mon service, Alexa prononce mal l'un des mots de ma réponse, ce qui déroute l'utilisateur.

Par exemple, si je voulais qu'Alexa dise un mot dans une langue différente (peut-être pour une compétence d'apprentissage de la langue), comment dire à Alexa comment prononcer le mot correctement, plutôt que d'appliquer des règles de prononciation en anglais?

Cela s'applique également aux mots anglais avec des prononciations impaires; existe-t-il un moyen de dicter à Alexa la prononciation correcte, ou de la remplacer par un son personnalisé qui est correct? Dois-je utiliser un balisage supplémentaire ou un appel API?

Aurora0001
la source

Réponses:

4

Alexa prend en charge SSML , qui est un langage de balisage de type XML pour la parole. Au lieu de renvoyer du texte brut de votre service, vous pouvez utiliser des réponses SSML. Le <phoneme>tag est ce dont vous avez besoin en particulier:

phonème

Fournit une prononciation phonémique / phonétique du texte contenu. Par exemple, les gens peuvent prononcer des mots comme «noix de pécan» différemment.

Pour les mots anglais (en particulier l'anglais américain), Alexa devrait pouvoir prononcer n'importe quel mot si vous lui donnez la prononciation phonétique correcte:

Les tableaux suivants répertorient les symboles pris en charge à utiliser avec la balise phoneme. Ces symboles offrent une couverture complète pour les sons de l'anglais américain. Notez que de nombreuses langues autres que l'anglais nécessitent l'utilisation de symboles non inclus dans cette liste, qui ne sont pas pris en charge. L'utilisation de symboles non inclus dans cette liste est déconseillée, car elle peut entraîner une synthèse vocale sous-optimale.

Citations de la documentation Amazon sur SSML.

Voici un exemple de définition d'une prononciation spécifique pour Alexa:

<speak>
    <phoneme alphabet="ipa" ph="hɛˈləʊ̯">Hello</phoneme>.
    <phoneme alphabet="ipa" ph="bɔ̃.ˈʒuʁ">Bonjour</phoneme>.
</speak> 

La <phoneme>balise prend en charge les alphabets phonétiques IPA et X-SAMPA . Vous pouvez généralement trouver des orthographes IPA pour n'importe quel mot sur Wiktionnaire ou via Google.

Pour les messages plus longs, il peut être préférable d'utiliser la <audio>balise et d'enregistrer une voix personnalisée:

La balise audio vous permet de fournir l'URL d'un fichier MP3 que le service Alexa peut lire tout en affichant une réponse. Vous pouvez l'utiliser pour intégrer de l'audio court et préenregistré dans la réponse de votre service. Par exemple, vous pouvez inclure des effets sonores à côté de vos réponses de synthèse vocale ou fournir des réponses à l'aide d'une voix associée à votre marque.

Extrait de la documentation d'Amazon sur <audio>.

Aurora0001
la source