2024-03-30 05:30:48
Clonez de manière fiable la voix humaine avec un échantillon de seulement 15 secondes. C’est ce que réalise le dernier outil d’intelligence artificielle créé par OpenAI, la société qui a ébloui le monde avec ChatGPT, son programme de langage d’IA générative.
« Aujourd’hui, nous partageons des informations et des résultats préliminaires d’un aperçu à petite échelle d’un modèle appelé Voice Engine, qui utilise du texte et un seul échantillon audio de 15 secondes pour générer une parole naturelle qui ressemble beaucoup au locuteur d’origine. Il est remarquable qu’un petit modèle avec un seul échantillon de 15 secondes puisse créer des voix émouvantes et réalistes”, a déclaré la société dirigée par Sam Altman dans un communiqué.
Tout ce que l’utilisateur a à faire est de fournir cet échantillon. Une fois que le programme Voice Engine l’a, vous pouvez lui faire lire n’importe quel texte que vous fournissez avec le timbre et le ton de cette voix. Il n’est même pas nécessaire que le texte soit dans la même langue. Un hispanophone peut fournir l’échantillon dans sa langue, puis demander au programme de lire un texte en anglais, en chinois ou dans d’autres langues avec sa voix.
Il peut également être utilisé directement pour la traduction audio. De plus, lorsqu’il est utilisé pour la traduction, Voice Engine préserve l’accent natif du locuteur d’origine : par exemple, générer de l’anglais avec un échantillon audio d’un locuteur français produirait un discours avec un accent français.
Utilisation restreinte
L’entreprise préfère pour l’instant lancer un test à petite échelle plutôt que de faciliter un accès généralisé à l’outil, comme elle l’a fait avec ChatGPT, car elle est consciente du risque d’usurpation d’identité. Avec l’outil, il suffit d’enregistrer 15 secondes de quelqu’un pour obtenir avec sa voix.
“Nous adoptons une approche prudente et éclairée en vue d’une publication plus large en raison du potentiel d’utilisation abusive des voix synthétiques”, déclare OpenAI. « Nous espérons entamer un dialogue sur le déploiement responsable des voix synthétiques et sur la manière dont la société peut s’adapter à ces nouvelles capacités. « Sur la base de ces conversations et des résultats de ces tests à petite échelle, nous prendrons une décision plus éclairée quant à l’opportunité et à la manière de déployer cette technologie à grande échelle », ajoute-t-il.
OpenAI considère qu’avant de généraliser l’accès au nouvel outil, des décisions doivent être prises sur une série d’aspects. Par exemple, il appelle à éliminer progressivement l’authentification vocale comme mesure de sécurité pour accéder aux comptes bancaires et autres informations sensibles, car elle ne serait plus sécurisée.
Il considère également qu’il est nécessaire d’explorer des politiques visant à protéger l’utilisation de la voix des individus dans l’intelligence artificielle. Le risque de manipulation et de désinformation est particulièrement marqué dans le cas des personnalités publiques, notamment politiques.
Par conséquent, il appelle également à éduquer le public pour qu’il comprenne les capacités et les limites des technologies d’IA, y compris la possibilité de contenu trompeur.
Une autre proposition qu’il met sur la table est d’accélérer le développement et l’adoption de techniques permettant de retracer l’origine du contenu audiovisuel, afin qu’il soit toujours clair quand vous interagissez avec une personne réelle ou avec une IA.
« Il est important que les gens du monde entier comprennent où va cette technologie, que nous la déployions nous-mêmes ou non à grande échelle. Nous sommes impatients de continuer à engager des conversations sur les défis et les opportunités des voix synthétiques avec les décideurs politiques, les chercheurs, les développeurs et les créatifs », conclut OpenAI.
Au cours de sa carrière d’innovations, OpenAI a lancé des outils non seulement pour le langage, mais aussi pour la génération d’images et de vidéos. Le mois dernier, Sora a été présenté, un outil vidéo révolutionnaire qui n’avait besoin que de texte pour créer une courte vidéo avec le contenu et le style requis.
Vous pouvez suivre Technologie EL PAÍS dans Facebook oui X ou inscrivez-vous ici pour recevoir notre bulletin d’information semanal.
#OpenAI #lance #outil #audio #capable #cloner #des #voix #humaines #Technologie
1711873915