TTS (Text-to-Speech)

Définition

Vous connaissez sûrement Siri, Alexa ou encore l’Assistant vocal Google. Difficile aujourd’hui de ne pas les reconnaître tant ces voix font partie intégrante de notre quotidien. Aujourd’hui, découvrez comment naissent ces célèbres voicebot grâce à la technologie TTS (Text-to-Speech).

Également appelée Synthèse vocale en français, la technologie TTS permet la transcription d’un texte écrit en message vocal.

Comment ça fonctionne ? Le TTS se base sur des graphèmes (lettres ou groupes de lettres), lesquelles transcrivent un phomène (élément sonore). Autrement dit, la ressource première de cette technologie n’est pas le son (comme c’est le cas pour son antonyme : l’ASR) mais bien le texte.

De plus, le fonctionnement du TTS se fait grâce à 2 systèmes complémentaires :

  • le front-end : chargé de la cohérence des transcriptions phonétiques ;
  • le back-end : chargé de la conversion du texte en son ;

Depuis quelques années, la synthèse vocale est omniprésente et son utilisation particulièrement fréquente. Autrefois utilisé pour permettre aux aveugles et malvoyants d’écouter des textes, les usages du TTS sont aujourd’hui infinis : jeux-vidéos, assistants personnels, e-learning, etc.

En téléphonie, le Text-to-Speech permet la modernisation des solutions de téléphonie utilisées par les professionnels. En effet, la synthèse vocale revêt différents avantages :

  • Amélioration de l’expérience utilisateur : l’utilisation d’une voix naturelle, s’apparentant à une voix humaine, ainsi que la possibilité de nouer un lien conversationnel contribuent à améliorer significativement l’expérience de l’utilisateur.
  • Amélioration de l’image de marque comme les géants Apple et Google en témoignent, la voix fait aujourd’hui partie intégrante de l’image de marque. Son utilisation permet l’acquisition d’une certaine cohérence. En effet, les communications sortantes d’une même entreprise sont toutes portées par une seule et même voix, au style particulier.
  • Gain de temps : le TTS permet de s’affranchir de tout enregistrement manuel autrefois effectué, un gain de temps considérable qui permettra à votre entreprise de gagner en rentabilité.

Aujourd’hui, de nombreux logiciels Text-to-Speech existent et les possibilités sont nombreuses : choix de la langue, du genre, de la qualité, etc. Autant de fonctionnalités qui vous permettront de trouver la voix idéale pour représenter votre entreprise.

Définitions similaires

Les personnes qui ont consulté cette définition ont également consulté les termes :