OpenAI améliore le modèle DALL-E avec la troisième itération

OpenAI améliore le modèle DALL-E avec la troisième itération

En janvier 2021, OpenAI a présenté DALL-E, puis a rendu la version bêta de DALL-E 2 disponible en juillet 2022. Les chercheurs de la start-up testent actuellement la troisième itération du modèle, qui sera disponible en octobre pour les clients de ChatGPT Plus et Enterprise via l’API d’OpenAI. Par la suite, DALL-E 3 sera également accessible dans OpenAI Labs, permettant ainsi à un public plus large de découvrir ses capacités.

Le défi pour les utilisateurs de modèles de « text to image », tels que DALL-E, est de trouver l’instruction qui permettra de générer l’image souhaitée.

Une meilleure compréhension des instructions

Selon OpenAI, DALL-E 3 présente des améliorations significatives par rapport à DALL-E 2, avec la même instruction. La société donne l’exemple des images générées par les deux versions du modèle pour l’instruction “Une peinture à l’huile expressive d’un joueur de basket-ball faisant un dunk, représentée comme une explosion d’une nébuleuse”, et comme on peut le constater ci-dessous, DALL-E 3 (à droite) a pu générer une image beaucoup plus précise.

Crédit OpenAI

L’intégration du modèle à ChatGPT

DALL-E 3 est intégré nativement à ChatGPT, ce qui permet aux utilisateurs d’utiliser ce dernier pour générer ou affiner leurs instructions, comme le montre cette vidéo.

Une attention particulière à la sécurité

OpenAI a limité la capacité de DALL-E 2 à générer des images violentes, haineuses ou pour adultes, et a utilisé des techniques avancées pour prévenir la génération de visages réels de personnes, notamment de personnalités publiques ou politiques. Pour réduire les biais, une nouvelle technique a été mise en œuvre pour générer des images de personnes représentatives de la diversité mondiale.

Ces mesures, qui ont été améliorées depuis, sont également appliquées à DALL-E 3. L’équipe de recherche explore également des moyens d’aider les utilisateurs à identifier les images générées par l’IA, grâce à un outil de classification de la provenance.

Créativité sous contrôle

DALL-E 3 a été conçu pour répondre aux demandes d’images dans le style d’un artiste vivant, préservant ainsi l’intégrité des créations artistiques.

Les images créées avec DALL-E 3 appartiennent aux utilisateurs, qui n’ont pas besoin d’autorisation pour les reproduire ou les commercialiser. Ils ont également la possibilité de retirer leurs images du processus de formation des futurs modèles de génération d’images.

OpenAI n’a pas révélé si le modèle serait gratuit à l’avenir, mais il sera possible de l’utiliser sans souscrire aux offres ChatGPT Plus ou Enterprise, car Microsoft a annoncé son prochain intégration à Bing Chat.

dans un article qui peut se classer élevé dans Google
#DALLE #bientôt #disponible #pour #les #utilisateurs #ChatGPT #Enterprise
publish_date] pt]

Facebook
Twitter
LinkedIn
Pinterest

Leave a Comment

This site uses Akismet to reduce spam. Learn how your comment data is processed.