ChatGPT : une avancée majeure dans la génération d'images

OpenAI a réalisé une avancée significative dans le domaine de la génération d’images par intelligence artificielle. L’entreprise a déployé une mise à jour de ChatGPT, accessible aux utilisateurs de tous les plans, gratuits et payants. intégrée au modèle 4o et située au sein de Sora, cette fonctionnalité produit des résultats de haute qualité, particulièrement avec des instructions claires et détaillées.

Ces fonctionnalités visent à faciliter la création d’images fidèles à l’imagination de l’utilisateur, permettant une communication plus efficace à travers les visuels et transformant ainsi la génération d’images en un outil pratique, précis et puissant.

Ce que ChatGPT sait faire

Table of Contents

Ce que ChatGPT sait faire
Ce que ChatGPT ne sait pas (encore) faire
ChatGPT et la génération d’images : Ce qu’il sait faire et ne pas faire

Qu’est-ce qui a changé récemment concernant les images ?

Il y a eu une évolution notable.

Reconnaissez-vous mieux ce qui se trouve dans une scène ?

Absolument. ChatGPT peut désormais :

comprendre la composition globale de la scène (groupes, poses, objets, environnements…).
Maintenir la cohérence des visages, de la couleur des cheveux, des expressions et même de l’âge.
Positionner les personnages fidèlement à l’original, en s’inspirant d’une photo réelle.

Concernant le style, puis-je choisir celui que je souhaite ?

Absolument. Voici quelques possibilités :

Cartoon style Pixar
Un style poétique à la Studio Ghibli
Un style plus bande dessinée française
ou un portrait de la renaissance.

Il suffit de le préciser pour transformer l’image dans le style désiré.

Puis-je vous demander de modifier une scène ? Ajouter quelqu’un, changer une expression ?

Oui, ChatGPT peut maintenant :

Ajouter ou supprimer des personnes.
Changer les expressions, les vêtements, les objets sur une table.
Réorganiser l’environnement : transformer une scène de jour en une scène de nuit, ou la rendre réaliste ou cartoon.

Si je vous demande de conserver les positions originales, comme sur une vraie photo ?

ChatGPT peut désormais maintenir :

Les positions exactes des sujets.
Les proportions correctes.
Tous les détails environnementaux (verres, téléphones, assiettes, arrière-plan urbain ou verdoyant…).

Ce que ChatGPT ne sait pas (encore) faire

Quelles sont les choses que vous ne pouvez pas encore faire ?

Voici les limitations actuelles :

Reconnaître des personnes réelles ou dire qui elles sont sur une photo. ChatGPT ne peut pas identifier des individus par leur nom ou leur statut (par exemple, « c’est Tizio » ou « cette personne est célèbre »), pour des raisons de confidentialité et de sécurité. Même s’il les reconnaît, il ne peut pas le révéler.
Modifier une seule personne sur une vraie photo (pour l’instant). ChatGPT peut générer de nouvelles versions, mais il ne peut pas encore éditer directement des photos originales réalistes, comme changer une expression ou une couleur de cheveux sur l’image existante.
Donner un contrôle complet sur la position de chaque personne. ChatGPT peut suivre les poses et les compositions assez bien, mais il ne peut pas encore placer précisément chaque personne (par exemple, « mets cette personne ici, celle-là là, celle-ci qui regarde à droite ») comme le ferait un éditeur photo avancé. Continuer une image générée comme s’il s’agissait d’un puzzle. Si une image est coupée, ChatGPT ne peut pas encore la « compléter » parfaitement à partir de cette base. Il est préférable de la régénérer à partir de zéro, en fournissant des instructions plus complètes.
Reproduire exactement le même visage/personnage plusieurs fois. Chaque génération est unique. Par conséquent, ChatGPT ne peut pas encore créer le même personnage dans trois poses différentes et obtenir une cohérence à 100 % dans les traits du visage.
* Animer directement une scène générée. ChatGPT peut créer des images très détaillées dans le style d’une animation, mais il ne peut pas encore créer des GIF ou des vidéos animées avec ces personnages en mouvement (comme Pixar ou Ghibli en mouvement).

ChatGPT et la génération d’images : Ce qu’il sait faire et ne pas faire

Qu’est-ce qui a changé récemment concernant la génération d’images avec ChatGPT ?

ChatGPT a grandement évolué dans la génération d’images grâce à son intégration avec le modèle 4o et sa connexion à Sora. Cette mise à jour est accessible à tous les utilisateurs, qu’ils soient gratuits ou payants [[1]]. Les résultats sont de haute qualité, particulièrement avec des instructions claires et détaillées.

Ce que chatgpt sait faire

Améliorations récentes :

Compréhension de la scène : ChatGPT comprend désormais la composition globale de la scène (groupes, poses, objets, environnements…).

Cohérence : Maintien de la cohérence des visages, couleurs de cheveux, expressions et âges des personnages.

Positionnement : Capacité à positionner les personnages fidèlement à l’original, en s’inspirant d’une photo réelle.

Choix de style :

Style Cartoon Pixar

Style poétique à la Studio Ghibli

Style bande dessinée française

Portrait de la Renaissance

Modification de scènes :

Ajout ou suppression de personnes

Changement d’expressions, de vêtements et d’objets

Réorganisation de l’environnement (jour/nuit, réaliste/cartoon)

Préservation des détails :

Maintien des positions exactes des sujets

Préservation des proportions correctes

Conservation des détails environnementaux (verres, téléphones, etc.)

Ce que ChatGPT ne sait pas (encore) faire

Limitations actuelles :

Identification des personnes réelles : Ne peut pas reconnaître ou identifier des personnes par leur nom ou statut.

Édition de photos réalistes : Ne peut pas modifier directement une personne sur une photo existante.

Contrôle précis du placement des personnes : Ne permet pas de placer précisément chaque personne.

Complétion d’images coupées : Ne peut pas compléter parfaitement une image coupée.

Reproduction exacte de visages : Ne peut pas créer le même personnage avec une cohérence à 100%.

* Animation directe de scènes : Ne peut pas créer de GIFs ou de vidéos animées.

FAQ

Q: Qu’est-ce que ChatGPT peut faire avec les images ?

R: Il peut générer des images à partir de texte,modifier des scènes,et appliquer différents styles artistiques.

Q: Puis-je choisir le style de l’image ?

R: Oui, vous pouvez choisir parmi plusieurs styles comme Pixar, Ghibli, bande dessinée française ou un portrait de la Renaissance.

Q: ChatGPT peut-il modifier une photo existante ?

R: Pour le moment, il ne peut pas modifier directement des photos réalistes, comme changer une expression ou une couleur de cheveux sur une image existante.

Q: ChatGPT peut-il reconnaître des personnes sur une photo ?

R: Non, pour des raisons de confidentialité et de sécurité, ChatGPT ne peut pas identifier les individus ni révéler qui ils sont sur une photo.

ChatGPT : une avancée majeure dans la génération d’images

Ce que ChatGPT sait faire

Ce que ChatGPT ne sait pas (encore) faire

ChatGPT et la génération d’images : Ce qu’il sait faire et ne pas faire

Qu’est-ce qui a changé récemment concernant la génération d’images avec ChatGPT ?

Ce que chatgpt sait faire

Ce que ChatGPT ne sait pas (encore) faire

FAQ

Share this:

Related

Exode vénézuélien : l’immigration forcée, terreau du crime organisé

Samuel Nacar, photographe catalan, récompensé au World Press Photo

You may also like

Leave a Comment Cancel Reply