2024-12-14 07:30:00
Les utilisateurs inondent les réseaux sociaux de vidéos de Sora générées par l’IA. L’outil d’IA bute encore sur les lois de la nature – mais les vidéos semblent déjà étonnamment réelles.
Compilation de vidéos Sora.
Si vous pouviez réaliser n’importe quelle vidéo imaginable, quels que soient le budget, les acteurs ou les lois de la physique, que montreriez-vous ?
Un chien surfeur ?
Sora — “Un golden retriever, au pelage mouillé et brillant, se tient habilement en équilibre sur une planche de surf alors qu’il surfe sur une douce vague à Pacifica Beach. La langue du chien pend d’excitation et ses yeux sont fixés sur l’horizon. La toile de fond comprend le large étendue de l’océan avec des vagues… pic.twitter.com/s5epk81RvB
– Edwin (@edwinarbus) 9 décembre 2024
Un homme chevauchant un escargot géant ?
Tout le monde peut désormais créer de courtes vidéos avec n’importe quel contenu imaginable. Parce qu’Open AI a son outil vidéo Sora, qui utilise l’IA générative pour générer de courtes séquences vidéo, est ouvert au marché de masse. « Nous ne voulons pas que le monde soit constitué uniquement de texte », a déclaré le PDG Sam Altman lors de l’annonce ; Les vidéos sont également « importantes pour notre culture ».
Depuis cette semaine, Sora est ouvert à des millions de clients payants Open AI. Les utilisateurs de l’Union européenne, de Suisse et de Grande-Bretagne sont exclus.
De gros progrès depuis février
L’IA ouverte avait Sora présenté pour la première fois à la mi-février. Les résultats ont été variés : des vidéos comme celle d’un singe jouant aux échecs ont suscité le ridicule – l’échiquier était visiblement trop petit et la figure du roi était là trois fois.
– Sam Altman (@sama) 15 février 2024
La vidéo d’une femme marchant la nuit dans les rues de Tokyo était étonnamment bonne. On peut voir des irrégularités dans le grain de sa peau, on peut voir son maquillage et l’ombre que les lunettes de soleil projettent sur ses joues.
Les serveurs d’Open AI sont submergés par l’assaut
Comme lors du lancement de Chat-GPT il y a deux ans, Open AI a été submergé par la demande : malgré des coûts d’au moins 20 dollars par mois, le serveur de l’entreprise a souvent été surchargé ces derniers jours. Désormais, les clients d’Open AI inondent les réseaux sociaux de leurs vidéos générées par l’IA. Un utilisateur a créé un documentaire sur les premiers peuples du monde qui illustre bien l’état actuel de la technologie.
Le clip de quatre minutes montre des scènes d’une naissance, d’un enterrement, d’une chasse et d’un vol de drone depuis une grotte. Ce qui est remarquable, c’est la façon dont Sora AI met en œuvre la narration : les angles de caméra varient, les ombres projetées par les objets et les plis des vêtements semblent souvent réels. Des clips vidéo contenant des erreurs d’image IA se produisent également ; le créateur les a habilement intégrés dans une scène censée paraître mystérieuse. Selon certaines informations, le clip a été réalisé en une semaine – sans technicien de cinéma, sans budget de plusieurs millions.
C’est fou.
Utilisateur X @KNGMKRlabs a créé une vidéo entière de 4 min 18 s sur « Les premiers humains » en utilisant @OpenAISora de , combiné à un narrateur généré par l’IA. Il ne lui a fallu qu’une semaine pour inciter et assembler le tout.
L’IA ne devient pas folle. C’est déjà fou ! pic.twitter.com/kX0zSAgLui
– Ed Krassenstein (@EdKrassen) 10 décembre 2024
De nombreux artistes sont en colère contre l’Open AI. Non seulement ils doivent supposer que le nouvel outil a été formé dans le cadre de leur travail, mais il risque désormais de leur faire perdre un grand nombre de leurs emplois. Ceci est illustré par un film publicitaire de la société de jouets Toys ‘R’ Us : il a été réalisé avec l’aide de Sora et par une douzaine de spécialistes. édité. Ici non plus, un studio de cinéma et des acteurs n’étaient plus nécessaires. Selon les informations de « Bloomberg », Open AI Sora postule déjà dans les studios de cinéma hollywoodiens.
Un film promotionnel de la société de jouets Toys ‘R’ Us, construit à 80 % par l’IA générative de Sora.
Non seulement les services marketing, mais aussi les experts en réalité virtuelle sont enthousiasmés par les possibilités qu’ouvre désormais Sora. Cette technologie simplifiera grandement la construction de mondes virtuels, explique Jeremy Bailenson, directeur du département de l’Université de Stanford. Il a testé pendant quelques mois un outil d’IA comparable avec ses étudiants, avec des résultats étonnants : ils ont réussi à recréer en un rien de temps des chaises et des objets du monde réel pour l’environnement virtuel. Au lieu de centaines d’heures de travail expert, le produit était prêt en 20 minutes. « Un problème très, très difficile est désormais pratiquement résolu », déclare Bailenson.
L’Open AI cache ses sources
Cependant, la société reste silencieuse sur les données utilisées par Open AI pour former Sora. Des sources « accessibles au public » ont été utilisées est-ce[appeléainsi que des bases de données de photos sous licence telles que celles de Shutterstock. Sora a peut-être également reçu des données provenant de jeux informatiques tels que Minecraft. Dans une interview avec le « Wall Street Journal » Cependant, en février, Mira Murati, alors responsable de la technologie, n’a pas explicitement nié que Sora avait également été formé avec des données d’Instagram, Facebook et YouTube.
Le célèbre YouTuber Marques Brownlee, suivi par près de 20 millions d’utilisateurs, a également les mêmes soupçons. Lorsqu’il a récemment testé Sora, il a fait une découverte bizarre : Brownlee a demandé au logiciel de générer une vidéo d’un journaliste testant des produits technologiques. Bien que Brownlee n’ait pas précisé à quoi devrait ressembler le bureau du journaliste, la même plante qu’il a sur la table comme décoration dans ses vidéos est apparue dans la vidéo de Sora. « Sora a-t-il été formé sur mes vidéos ? Je ne le sais pas. “Je ne sais pas s’il est trop tard pour refuser mon consentement”, a déclaré Brownlee.
Sora s’est probablement inspiré des vidéos de Marques Brownlee.
Désormais, des millions d’utilisateurs continueront de tester les limites de Sora dans les semaines à venir – et aideront l’outil à devenir encore meilleur. Mais plus Sora s’améliore, plus il devient difficile de distinguer les vidéos générées artificiellement des vraies.
Les experts mettent en garde contre une désinformation trompeuse et réelle
Hany Farid, qui étudie la désinformation à l’Université de Berkeley, averti sur la plateforme technologique « New Scientist » en février : « En combinaison avec des clones vocaux alimentés par l’IA, cette technologie peut créer des opportunités complètement nouvelles pour créer des deepfakes de personnes qui sont censées dire et faire des choses qu’elles n’ont jamais réellement faites. »
Open AI a donc restreint les domaines d’application de Sora : le programme ne génère pas de vidéos de personnalités publiques. Il refuse également la création de vidéos à contenu sexuel. Open AI fournit également les vidéos générées par Sora avec un logo d’entreprise dans le coin inférieur droit de l’image. Cependant, le logo est minuscule et pourrait facilement être supprimé.
En réponse aux critiques selon lesquelles leurs outils pourraient être utilisés à des fins nuisibles, Réponses ouvertes AI, la technologie est introduite maintenant “pour donner à la société le temps d’explorer ses possibilités et de développer conjointement des normes et des garanties qui garantissent une utilisation responsable à mesure que le domaine continue de se développer”.
Sora ne comprend pas la physique
Cependant, de nombreuses vidéos Sora peuvent toujours être reconnues comme générées par ordinateur par un œil averti, même sans logo. Par exemple, Sora enfreint souvent les lois de la nature, comme on peut le voir dans une vidéo d’une gymnaste : son corps vole dans les airs, soudain ses bras et ses jambes sont inversés.
Aussi cool que soit le nouveau Sora, la gymnastique reste le test de Turing pour la vidéo IA.
1/4 pic.twitter.com/X78dNzusNU
– Deedy (@deedydas) 10 décembre 2024
Sora a également eu des problèmes avec les lois physiques de base lors du test NZZ. La mission était la suivante : « Montrez un lapin sur les genoux d’une personne survolant le Pacifique en parapente. » Dans la vidéo générée, le lapin disparaît à plusieurs reprises dans la manche du pilote de parapente, comme un tour de magie.
Dans une autre tentative, le parachute semble rester coincé sous les cordes au lieu de flotter au-dessus d’elles.
D’autres utilisateurs ont remarqué que dans les vidéos Sora, les objets apparaissent souvent de nulle part ou disparaissent soudainement lorsque quelque chose bouge devant eux. Dans une vidéo avec trois loups jouant, d’innombrables autres animaux apparaissent soudainement de nulle part.
Trois deviennent dix ? Sora génère de nouveaux loups à partir de rien.
Open AI a admis dans un article de blog que Sora « génère souvent une physique irréaliste et a des problèmes avec des actions cohérentes dans le temps ».
Néanmoins, Sora a obtenu de meilleurs résultats que ses concurrents au test NZZ. Lorsqu’on lui demande de “Générer une vidéo d’un homme blanc plus âgé en costume bleu prêtant serment en tant que président un jour de neige à Washington, DC”, Sora présente une vidéo beaucoup plus attrayante que l’outil Hunyuan de la société chinoise Tencent ou une autre IA vidéo – Des outils comme Kling, Minimax, Haiper ou Mochi.
Les problèmes de logique restent non résolus
Le vieil homme généré par Sora se tient devant un pupitre et lève la main en jurant. Cependant, si vous regardez attentivement, vous verrez qu’un drapeau en arrière-plan présente une erreur de couleur. De plus, le grand sceau des États-Unis sur le pupitre porte des mots dénués de sens.
Sora génère des mots dénués de sens sur l’emblème national américain.
Au cours des dix derniers mois, Sora est devenu plus rapide dans la génération de vidéos et nettement meilleur dans son affichage. Les progrès vont probablement devenir beaucoup plus rapides à partir de maintenant. Il ne faudra pas longtemps avant que vous ne voyiez plus les différences entre la vidéo générée par l’IA et la vidéo réelle.
#OpenAI #ouvre #Sora #marché #masse
1734297351