Par Arthur Vera – @artvera_
Publié le 21 mai 2019 à 12h10
Fini la voix robotique de Google Traduction, des chercheurs de chez Google AI ont réussi à développer une intelligence artificielle capable de traduire les paroles d’un orateur, tout en gardant l’intonation originale. Pour le moment, les résultats ne sont pas parfaits, cependant les premiers essais sont plutôt prometteurs.
Contrairement aux traducteurs numériques habituels, ce programme convertit directement l’entrée audio en sortie audio, sans aucune étape intermédiaire. Google Traduction, par exemple, traduit d’abord l’audio en texte, puis traduit le texte, pour ensuite le prononcer à l’oral avec une voix tout sauf naturelle.
Pour mieux comprendre, faisons un test. Le premier enregistrement est un extrait d’espagnol.
Voici maintenant sa traduction en anglais avec un traducteur de type Google Traduction, ou Reverso.
Le dernier extrait est toujours la traduction du premier, néanmoins elle est cette fois-ci réalisée par Translatotron, le nouveau programme développé par Google AI.
Google AI avait précisément expliqué le fonctionnement de Translatotron, le mois dernier sur ArXiv. Pour faire simple, Translatotron est composé de trois éléments en charge de produire une traduction parfaite. Le premier composant utilise un réseau neuronal afin d’associer le spectrogramme audio dans sa langue d’origine au spectrogramme audio dans la langue de sortie. Ensuite, le deuxième composant convertit le spectrogramme en une onde audio. Pour finir, le troisième composant permet de finaliser l’intonation de la voix en superposant les caractéristiques vocales d’origine avec la version finale. Ce programme en trois devrait minimiser les erreurs de traduction, par rapport aux autres services qui utilisent bien plus d’étapes.
Les premiers essais n’ont testé que la traduction de l’anglais vers l’espagnol, et selon les informations de l’équipe de recherche, cela a déjà nécessité un grand nombre de données pour former correctement cette IA. Toutefois il est important de noter que les premiers clips audio sont plutôt prometteurs en vue d’un éventuel service grand public.
Publié le 10 novembre 2022 à 15h28
Publié le 9 novembre 2022 à 15h32
Publié le 9 novembre 2022 à 13h13
Publié le 8 novembre 2022 à 16h12
Publié le 8 novembre 2022 à 14h12
Publié le 7 novembre 2022 à 15h24
Modifier mes choix de cookies
© 2021 Siècle Digital est une marque déposée par SHINE MEDIA SAS. Tous droits réservés