OpenAI a lancé un service d’IA texte-vidéo révolutionnaire : « Sora ».
Presque impossible de dire que ce n’est pas réel
Le contenu vidéo créé simplement en décrivant en quelques phrases ce que l’on souhaite est d’une telle qualité qu’il est difficile d’imaginer qu’il ne changera pas pour toujours l’industrie du divertissement, et plus encore. La plus grande limitation est la durée des vidéos qui sont limitées à une minute, donc longue, mais là encore, il s’agit d’une version bêta.
Pour l’instant, Sora est dans une phase de test à laquelle les créateurs ont accès en premier : “Aujourd’hui, Sora devient disponible pour les “équipes rouges” pour pouvoir évaluer les zones critiques en termes de dommages ou de risques potentiels. Nous donnons également accès à un éventail d’artistes visuels, de designers et de cinéastes pour obtenir des commentaires sur la manière de faire progresser le modèle afin qu’il soit le plus utile aux professionnels de la création.
OpenAI affirme qu’elle partage déjà son travail avec des tiers pour obtenir des commentaires, ce qui signifie que la technologie s’améliorera rapidement par rapport à ce qui est déjà perçu comme réel, du moins à partir des clips partagés par l’entreprise. Cependant, des erreurs peuvent survenir, et elles peuvent ressembler à ceci. :
OpenAI :
« Sora s’appuie sur des recherches antérieures avec les modèles DALL·E et GPT et utilise la technique de répétition de DALL·E 3, qui consiste à générer des légendes hautement descriptives pour les données d’entraînement visuel. En conséquence, le modèle est capable de suivre plus fidèlement les instructions textuelles de l’utilisateur dans la vidéo générée. En plus de pouvoir générer une vidéo uniquement à partir d’instructions textuelles, le modèle est capable de prendre une image fixe existante et de générer une vidéo à partir de celle-ci, ainsi que d’animer le contenu de l’image avec précision et attention aux petits détails. Le modèle peut également prendre une vidéo existante et l’agrandir ou remplir les images manquantes.
Des erreurs peuvent survenir
“Le modèle actuel présente des faiblesses. Il peut avoir du mal à simuler avec précision la physique d’une scène complexe et à comprendre des cas spécifiques de cause à effet. Par exemple, une personne peut prendre une bouchée d’un cookie, mais il peut arriver ensuite que le cookie soit tout aussi entier. Le modèle peut également être confus quant aux détails dans l’espace dans une invite, par exemple en mélangeant gauche et droite, et peut avoir du mal avec des descriptions précises d’événements qui se déroulent au fil du temps, comme suivre un chemin de caméra spécifique”, rapporte OpenAI dans la presse. communiqué sur les erreurs potentielles.
OpenAI précise qu’il permettra de détecter si une vidéo a été créée par Sora et inclura à l’avenir des métadonnées C2PA à propos le modèle est inclus dans un produit OpenAI.
Voir plus de vidéos de démonstration sans erreurs :