OpenAI présente une IA de synthèse vocale capable d’imiter la voix après 15 secondes d’audio – IT Pro – Actualités

OpenAI présente une IA de synthèse vocale capable d’imiter la voix après 15 secondes d’audio – IT Pro – Actualités

OpenAI a créé un outil capable d’imiter une voix à partir d’un fragment de quinze secondes. La société a publié des échantillons de Voice Engine, mais ne souhaite pas rendre public immédiatement l’intégralité du modèle.

OpenAI, la société d’IA qui fabrique également ChatGPT, décrit l’outil dans un article de blog. Le modèle s’appelle Voice Engine et peut lire les textes qu’un utilisateur fournit comme entrée textuelle. Sur la base d’un échantillon audio, OpenAI affirme que l’IA peut complètement imiter une voix, y compris l’intonation et l’émotion. Un tel fragment ne doit durer que quinze secondes, précise l’entreprise.

La société ne divulgue aucune donnée sur l’outil, et aucun livre blanc ou autre description technique n’est disponible. On ne sait donc pas, par exemple, sur quels fragments audio Voice Engine a été entraîné. OpenAI dit à TechCrunch qu’il s’agit d’une combinaison de données sous licence et accessibles au public. Selon l’entreprise, Voice Engine n’est pas formé sur les données des utilisateurs. Les échantillons créés par les utilisateurs sont également supprimés par la suite.

Selon TechCrunch, l’outil devrait coûter de l’argent à l’avenir, même si OpenAI n’en dit rien publiquement. La société facturerait 15 dollars par million de caractères, soit environ 160 000 mots pouvant être prononcés, selon des documents.

Voice Engine n’est pas encore disponible pour les utilisateurs, comme c’est souvent le cas avec des services similaires de nos jours. L’année dernière, Meta a présenté Voicebox qui peut également générer du texte parlé basé sur de courts fichiers audio, mais la société ne propose pas non plus cet outil. OpenAI dit qu’elle est également prudente à ce sujet en raison des implications. L’outil pourrait rapidement être mal utilisé. OpenAI fait spécifiquement référence aux États-Unis, où des élections présidentielles auront lieu à la fin de cette année et où la bataille électorale a maintenant commencé.

La société a publié un certain nombre d’exemples sur un blog montrant ce que l’outil peut faire. De plus, OpenAI teste Voice Engine avec un nombre limité de testeurs. Ils devaient signer au préalable une déclaration stipulant qu’ils ne généreraient pas de textes sans l’autorisation de la personne concernée. L’outil aura également un filigrane indiquant que l’audio a été généré et OpenAI dit qu’il « surveille de manière proactive » la façon dont le système est utilisé. Lorsque l’outil sera publié à l’avenir, OpenAI souhaite également créer une liste de voix qui ne doivent pas être clonées.

2024-03-29 22:46:34
1711767292


#OpenAI #présente #une #synthèse #vocale #capable #dimiter #voix #après #secondes #daudio #Pro #Actualités

Facebook
Twitter
LinkedIn
Pinterest

Leave a Comment

This site uses Akismet to reduce spam. Learn how your comment data is processed.