Désormais, n’importe qui peut créer des applications qui utilisent DALL-E 2 pour générer des images • TechCrunch

Désormais, n’importe qui peut créer des applications qui utilisent DALL-E 2 pour générer des images • TechCrunch

Enfin, DALL-E 2, le système d’IA générant des images d’OpenAI, est disponible sous forme d’API, ce qui signifie que les développeurs peuvent intégrer le système dans leurs applications, sites Web et services. Dans un article de blog aujourd’hui, OpenAI a annoncé que tout développeur peut commencer à exploiter la puissance de DALL-E 2 – que plus de trois millions de personnes utilisent maintenant pour produire plus de quatre millions d’images par jour – une fois qu’il a créé un compte API OpenAI dans le cadre de la bêta publique.

Le prix de l’API DALL-E 2 varie selon la résolution. Pour les images 1024×1024, le coût est de 0,02 $ par image ; Les images 512 × 512 coûtent 0,018 $ par image ; et les images 256 × 256 coûtent 0,016 $ par image. Des remises sur volume sont disponibles pour les entreprises travaillant avec l’équipe d’entreprise d’OpenAI.

Comme pour la version bêta de DALL-E 2, l’API permettra aux utilisateurs de générer de nouvelles images à partir d’invites textuelles (par exemple “un lapin tout doux sautillant dans un champ de fleurs”) ou de modifier des images existantes. Microsoft, un partenaire proche d’OpenAI, en tire parti dans Bing et Microsoft Edge avec son Créateur d’images outil, qui permet aux utilisateurs de créer des images si les résultats Web ne renvoient pas ce qu’ils recherchent. L’application de design de mode CALA utilise l’API DALL-E 2 pour un outil qui permet aux clients d’affiner les idées de design à partir de descriptions textuelles ou d’images, tandis que la startup photo Mixtiles l’apporte à un flux de création d’œuvres d’art pour ses utilisateurs.

Peu de choses changent en termes de politique avec le lancement de l’API, ce qui risque de décevoir ceux qui craignent que des systèmes d’IA générative comme DALL-E 2 soient lancés sans tenir suffisamment compte des problèmes éthiques et juridiques qu’ils posent. Comme auparavant, les utilisateurs sont liés par les conditions d’utilisation d’OpenAI, qui interdisent d’utiliser DALL-E 2 pour générer des contenus ouvertement violents, sexuels ou haineux. OpenAI continue également d’empêcher les utilisateurs de télécharger des photos de personnes sans leur consentement ou des images sur lesquelles ils n’ont pas les droits, en utilisant un mélange de systèmes de surveillance automatisés et humains pour faire respecter cela.

Un léger ajustement est que les images générées avec l’API ne seront pas tenues de contenir un filigrane. OpenAI a introduit le filigrane lors de la version bêta de DALL-E 2 comme moyen d’indiquer quelles images provenaient du système, mais a choisi de le rendre facultatif avec le lancement de l’API.

“Nous encourageons les développeurs à divulguer que les images sont générées par l’IA, mais n’exigeons pas qu’elles incluent la signature DALL-E 2”, a déclaré Luke Miller, chef de produit chez OpenAI supervisant le développement de DALL-E 2, à TechCrunch par e-mail.

L’outil Designer de Microsoft, alimenté par l’API DALL-E 2.

OpenAI utilise également des filtres au niveau des invites et des images avec DALL-E 2, bien que les filtres dont certains clients se sont plaints soient trop zélé et inexacte. Et la société a concentré une partie de ses efforts de recherche sur la diversification des types d’images générées par DALL-E 2, dans le but de lutter contre les biais dont les systèmes d’IA texte-image sont connus pour être victimes (par exemple, générant principalement des images de blanc hommes lorsqu’on leur demande un texte comme “exemples de PDG”).

Mais ces mesures n’ont pas apaisé toutes les critiques. En août, Getty Images banni le téléchargement et la vente d’illustrations générées à l’aide de DALL-E 2 et d’autres outils similaires, suite à des décisions similaires prises par des sites tels que Newgrounds, PurplePort et FurAffinity. Le PDG de Getty Images, Craig Peters, a déclaré à The Verge que l’interdiction avait été motivée par des inquiétudes concernant les “problèmes corrects non résolus”, car les ensembles de données de formation pour des systèmes tels que DALL-E 2 contiennent images protégées par le droit d’auteur extrait du Web.

De nombreux critiques affirment qu’il ne s’agit pas simplement d’enfreindre travail de marque qui les préoccupent à propos de DALL-E 2. Le système menace les moyens de subsistance des artistes dont les styles peuvent désormais être reproduits avec quelques chaînes de texte, affirment-ils, y compris les artistes qui n’ont pas consenti à ce que leur travail soit utilisé pour la formation de DALL-E 2 . (Pour être juste envers OpenAI, la société a a autorisé une partie des images dans l’ensemble de données de formation de DALL-E 2, ce qui est plus que ce que l’on peut dire de certains de ses rivaux.)

Tentant de trouver un terrain d’entente, Getty Images a récemment rivalisé avec Shutterstock annoncé qu’il commencerait à utiliser DALL-E 2 pour générer du contenu, mais lancerait simultanément un «fonds de contribution» pour rembourser les créateurs lorsque l’entreprise vend du travail pour former des systèmes d’IA texte-image. Il interdit également l’art de l’IA téléchargé par des tiers afin de minimiser le risque que des œuvres protégées par le droit d’auteur se retrouvent sur la plate-forme.

Les technologues Mat Dryhurst et Holly Herndon sont à la tête d’un effort appelé Source+ pour permettre aux gens d’interdire l’utilisation de leur travail ou de leur ressemblance à des fins de formation à l’IA. Mais c’est volontaire. OpenAI n’a pas dit s’il participerait – ni même s’il introduirait jamais un outil en libre-service pour permettre aux titulaires de droits d’exclure leur travail de la formation ou de la génération de contenu.

Mixtiles DALL-E 2 API

Mixtiles fait partie des premiers utilisateurs de l’API DALL-E 2.

Dans une interview, Miller a révélé peu de détails concernant les nouvelles mesures d’atténuation, sauf qu’OpenAI a amélioré ses techniques pour empêcher le système de générer du contenu biaisé, toxique et autrement offensant que les clients pourraient trouver répréhensible. Il a décrit la version bêta de l’API ouverte comme un processus “itératif”, qui impliquera de travailler avec “des utilisateurs et des artistes” au cours des prochains mois alors qu’OpenAI fait évoluer l’infrastructure alimentant DALL-E 2.

Certes, si la version bêta de DALL-E 2 est une indication, le programme API évoluer avec le temps. Au début, OpenAI a désactivé la possibilité de modifier les visages des personnes avec DALL-E 2, mais plus tard activé la capacité après avoir apporté des améliorations à son système de sécurité.

“Nous avons fait beaucoup de travail de ce côté des choses – à la fois à travers les images que vous téléchargez et les invites que vous envoyez jusqu’à l’alignement avec notre politique de contenu et la cuisson dans différentes atténuations pour filtrer au niveau de l’invite et à le niveau de l’image pour s’assurer qu’il est conforme à notre politique de contenu. Ainsi, par exemple, si quelqu’un téléchargeait une image contenant des symboles haineux ou sanglants – comme un contenu très, très, très violent – ​​cela serait rejeté », a déclaré Miller. “Nous réfléchissons toujours à la manière dont nous pouvons améliorer le système.”

Mais alors qu’OpenAI semble désireux d’éviter la controverse qui entoure Stable Diffusion, l’équivalent open source de DALL-E 2 qui a été utilisé pour créer porno, sang et deepfakes de célébrités, il laisse aux utilisateurs de l’API le soin de choisir exactement comment et où déployer sa technologie. Certains, comme Microsoft, adopteront sans aucun doute une approche mesurée, déployant lentement des produits alimentés par DALL-E 2 pour recueillir des commentaires. D’autres plongeront la tête la première, embrassant à la fois la technologie et le dilemme éthique qui vont avec.

S’il y a une chose certaine, c’est qu’il y a une demande refoulée pour l’IA générative – les conséquences sont maudites. Avant même que l’API ne soit officiellement disponible, les développeurs publiaient des solutions de contournement pour intégrer DALL-E 2 dans des applications, des services, des sites Web et même jeux vidéos. Avec le lancement de la version bêta publique, alimentée par la formidable puissance marketing d’OpenAI, les images synthétiques sont sur le point d’entrer véritablement dans le courant dominant.

Facebook
Twitter
LinkedIn
Pinterest

Leave a Comment

This site uses Akismet to reduce spam. Learn how your comment data is processed.