Des vidéos réalistes sans son sont créées par une nouvelle intelligence artificielle (IA) générative d’OpenAI. Le service s’appelle Sora et crée des vidéos d’une durée maximale de 20 secondes à la demande. Sora n’est actuellement pas disponible dans les pays germanophones. Mais en Amérique du Nord, les abonnés ChatGPT existants peuvent saisir des instructions uniquement sous forme de texte ou sous forme de texte enrichi d’images fixes ou de vidéos. Les résultats ont une résolution allant jusqu’à 1080p et peuvent être commandés au format carré, portrait ou paysage.
Publicité
Avec Sora, OpenAI lance également un modèle sœur plus petit appelé Sora Turbo. Il calcule plus rapidement, mais ne produit pas des vidéos aussi bonnes. Les abonnés ChatGPT Plus peuvent générer 50 vidéos basse résolution (480p) ou moins à moyenne résolution (720p) par mois. Toute personne disposant de l’abonnement ChatGPT Pro de 200 $ peut commander dix fois plus de vidéos, dans une résolution plus élevée et d’une durée plus longue. Au début de l’année prochaine, OpenAI souhaite mettre sur le marché des modèles tarifaires supplémentaires afin de s’adresser à différents groupes d’utilisateurs.
Les vidéos créées oscillent entre un réalisme effrayant et impressionnant et des erreurs évidentes. OpenAI admet ouvertement que Sora n’est pas parfait : « La version de Sora que nous avons publiée présente de nombreuses limitations. Elle crée souvent une physique irréaliste et se débat avec des processus complexes sur des durées d’exécution plus longues », écrit la société dans son annonce. Toutes les vidéos sont filigranées par la C2PA (Coalition for Content Provenance and Authenticity), et une animation OpenAI est également visible en bas à droite.
Il y a des règles
Le téléchargement d’enregistrements de mineurs n’est pas autorisé. Les photos d’autres personnes ne peuvent être utilisées dans le cadre de l’invite que si les personnes photographiées y ont consenti. De plus, les utilisateurs doivent s’assurer qu’ils renoncent à tous les droits de propriété intellectuelle nécessaires. Les représentations de violence et les « thèmes explicites », c’est-à-dire les contenus qui ne conviennent pas aux jeunes, sont interdits. Toute personne utilisant Sora de manière contraire à la réglementation peut être bloquée temporairement ou définitivement sans recevoir de remboursement des frais déjà payés, prévient OpenAI.
L’interface utilisateur sur le Site Internet de Sora montre les vidéos que d’autres utilisateurs ont commandées. Les invites exactes qui ont conduit à la vidéo respective peuvent être appelées. OpenAI donne à ses utilisateurs un aperçu de l’art de l’invite de l’IA.
À propos, les vidéos Sora ne peuvent pas être commandées simplement avec des invites individuelles ; l’interface vous permet de constituer un storyboard. Une série d’instructions peut être saisie pour calculer une vidéo continue avec différentes scènes.
Des méfaits surviennent
heise online n’a pas encore pu tester Sora, mais le YouTuber américain Marques Brownlee a pu passer une semaine avec. Dans ses exemples, il n’est pas toujours clair si une scène est réellement filmée ou générée par Sora. Cependant, Brownlee montre également des exemples où les erreurs ne peuvent être négligées.
Les affichages de texte sont parfois un fouillis de personnages, d’animaux ou d’objets, parfois disparaissent soudainement et sans motivation. Les animaux et les objets ont également tendance à se déplacer les uns autour des autres. Sora a également du mal avec la représentation des jambes, des animaux en mouvement et des conditions physiques générales. Ces insuffisances sont moins importantes dans les représentations abstraites et les films de type dessin animé que dans les vidéos qui se veulent réalistes.
Nous savons grâce à la vidéo de Brownlee qu’OpenAI propose des téléchargements sans filigrane si vous le souhaitez. Cela ne concerne probablement que l’animation visible, mais nous n’avons pas encore pu le déterminer. La sortie de Sora s’inscrit dans le cadre des “Shipmas” d’OpenAI, douze jours de nouvelles innovations.
(ds)
#Sora #lIA #vidéo #dOpenAI #est #là