Nouvelles Du Monde

Comment entraîner une IA à ressembler à vous

Comment entraîner une IA à ressembler à vous

Vous ne le voyez peut-être pas de cette façon, mais vous entendez probablement des voix d’IA tout le temps. Lorsque vous parlez à Alexa ou Siri, il s’agit d’un modèle formé à la parole humaine pour pouvoir dire presque n’importe quoi. Avez-vous déjà demandé à une célébrité de vous indiquer des directions sur Waze ? IA. Et chaque fois que vous regardez TikTok et que vous entendez cette voix un peu trop criarde prononcer les légendes à haute voix, c’est de l’IA jusqu’au bout. Bon sang, l’IA d’Apple vous lira même un roman d’amour avant d’aller vous coucher.

Les systèmes d’IA parviennent à transformer un texte en un discours crédible dans presque toutes les langues et presque toutes les voix. Et dans cet épisode de Le Vergecast, le premier de notre mini-série en trois parties sur l’IA, cette voix est la mienne. Nous avons formé un tas de robots IA différents avec le son de ma voix – parfois en lisant des scripts pleins de phrases absurdes, parfois en téléchargeant des heures d’audio existant à partir d’anciens Bordcast épisodes, parfois un peu de chacun – pour voir dans quelle mesure – et à quelle vitesse – nous pourrions faire une copie IA passable de ma voix.

Lire aussi  Dan D'Agostino dévoile son amplificateur intégré stéréo modulaire Momentum MxV au High End de Munich 2023

C’était… assez sauvage. Voici l’épisode :

Et si vous souhaitez une comparaison rapide des différents outils, voici d’abord le discours de référence que nous avons utilisé du grand Dwight Schrute :

Nous avons transcrit ce texte et l’avons introduit dans chaque générateur d’IA que nous avons testé. Voici comment Podcastle l’a interprété avec la voix de l’IA David Pierce :

Voici ce que Descript a fait avec la même chose :

Et la nouvelle fonctionnalité Personal Voice dans iOS 17 :

Et enfin, ElevenLabs, de loin le plus réaliste et le plus impressionnant des outils que nous avons testés :

En fin de compte, je ne pense pas qu’aucune des voix de l’IA ne me remplacera. Mais ils s’améliorent très rapidement et soulèvent à la fois d’énormes possibilités et d’énormes questions. Qu’est-ce que cela signifie que je puisse créer une réplique aussi bonne et qu’elle ne fera que s’améliorer et être plus facile avec le temps ? Quelles responsabilités ai-je en tant que personne qui l’a réalisé ? Quelles sont les responsabilités des autres ?

Lire aussi  Du diagnostic de kératite infectieuse à la discrimination des sous-types fongiques ; une étude basée sur l'apprentissage profond

Nous avons évidemment beaucoup de débats sur la musique IA en ce moment, car les voix des artistes sont utilisées pour former des modèles capables de créer des chansons assez convaincantes avec la voix de n’importe qui. Cela va engendrer une décennie de procès intéressants et de débats éthiques, mais ces mêmes choses arriveront juste pour vous et moi. Comment utilisons-nous ces outils ? Comment en parle-t-on ? Est-il même possible d’en obtenir des choses bonnes, utiles et démocratisantes sans tous les deepfakes et tous les problèmes ? Nous avons beaucoup de choses à découvrir et pas de temps à perdre. Parce que la technologie est vraiment bonne en ce moment, et elle s’améliore très rapidement.

2023-09-11 16:47:45
1694440874


#Comment #entraîner #une #ressembler #vous

Facebook
Twitter
LinkedIn
Pinterest

Leave a Comment

This site uses Akismet to reduce spam. Learn how your comment data is processed.

ADVERTISEMENT