La semaine dernière, OpenAI a dévoilé une nouvelle interface conversationnelle pour ChatGPT avec une voix synthétique et expressive étonnamment similaire à celle de l’assistante IA jouée par Scarlett Johansson dans le film de science-fiction. Son-seulement pour désactiver soudainement la nouvelle voix ce week-end.
Lundi, Johansson a publié une déclaration affirmant avoir forcé ce renversement, après que ses avocats ont demandé à OpenAI de clarifier comment la nouvelle voix avait été créée.
Johansson déclaration, relayée à WIRED par son publiciste, affirme que le PDG d’OpenAI, Sam Altman, lui a demandé en septembre dernier de fournir la nouvelle voix de ChatGPT mais qu’elle a refusé. Elle décrit avoir été stupéfaite de voir la société présenter la semaine dernière une nouvelle voix pour ChatGPT qui lui ressemblait de toute façon.
“Quand j’ai entendu la démo, j’ai été choqué, en colère et incrédule que M. Altman puisse poursuivre une voix qui ressemblait si étrangement à la mienne que mes amis les plus proches et les médias ne pouvaient pas faire la différence”, peut-on lire dans le communiqué. Il note qu’Altman a semblé encourager le monde à relier la démo à la performance de Johansson en tweetant “son», en référence au film, le 13 mai.
La déclaration de Johansson indique que son agent a été contacté par Altman deux jours avant la démo de la semaine dernière pour lui demander de reconsidérer sa décision de ne pas travailler avec OpenAI. Après avoir vu la démo, elle dit avoir engagé un conseiller juridique pour écrire à OpenAI pour lui demander des détails sur la manière dont la nouvelle voix a été créée.
Le communiqué affirme que cela a conduit à l’annonce d’OpenAI dimanche dans un poster sur X qu’elle avait décidé de « suspendre l’utilisation de Sky », le nom donné par la société à la voix synthétique. La société a également publié un article de blog décrivant le processus utilisé pour créer la voix. “La voix de Sky n’est pas une imitation de Scarlett Johansson mais appartient à une autre actrice professionnelle utilisant sa propre voix naturelle”, indique le message.
Sky est l’une des nombreuses voix synthétiques qu’OpenAI a données à ChatGPT en septembre dernier, mais lors de l’événement de la semaine dernière, elle a affiché une intonation beaucoup plus réaliste avec des signaux émotionnels. La démo a vu une version de ChatGPT alimentée par un nouveau modèle d’IA appelé GPT-4o apparaître flirter avec un ingénieur OpenAI d’une manière que de nombreux téléspectateurs ont trouvée rappelant la performance de Johansson dans Son.
“La voix de Sky n’est pas celle de Scarlett Johansson, et elle n’a jamais été conçue pour ressembler à la sienne”, a déclaré Sam Altman dans un communiqué fourni par OpenAI. Il a affirmé que le doubleur derrière la voix de Sky avait été embauché avant que la société ne contacte Johannsson. « Par respect pour Mme Johansson, nous avons cessé d’utiliser la voix de Sky dans nos produits. Nous sommes désolés auprès de Mme Johansson de ne pas avoir mieux communiqué.
L’IA générative a rendu beaucoup plus facile la création de voix synthétiques réalistes, créant ainsi de nouvelles opportunités et menaces. En janvier, les électeurs du New Hampshire ont été bombardés d’appels automatisés contenant un message vocal truqué de Joe Biden. En mars, OpenAI a annoncé avoir développé une technologie capable de cloner la voix d’une personne à partir d’un clip de 15 secondes, mais la société a déclaré qu’elle ne publierait pas cette technologie en raison d’un risque d’utilisation abusive.