Le modèle GPT-4o d’OpenAI apporte une avancée majeure en matière de génération et de modification d’images.
Lors d’un événement en direct le 25 mars, Sam Altman a présenté cette nouvelle fonctionnalité, qui permet désormais de générer des images mais aussi de les ajuster directement via l’interface du chatbot. De plus, il est désormais possible de créer du texte sans fautes, une amélioration importante par rapport aux erreurs fréquentes dans les générations précédentes d’IA. Cette fonctionnalité est également accessible dans Sora, l’outil de génération vidéo d’OpenAI.

GPT-4o améliore la génération d’images en prenant plus de temps pour produire des résultats plus précis et détaillés. Par exemple, l’IA peut désormais modifier des images existantes en y ajoutant des éléments ou en plaçant un sujet dans différents décors et situations, même avec des animaux. Une autre grande nouveauté est la possibilité de créer du texte sans erreur, ce qui était un point faible de Dall-E 3. Cela permet notamment d’ajouter des légendes aux images ou de concevoir des logos de manière plus précise.

En plus de la génération d’images, GPT-4o est aussi capable de produire divers formats, comme des bandes dessinées avec du texte correct. Le modèle comprend mieux les demandes des utilisateurs, sans avoir besoin d’une formulation complexe.
Selon OpenAI, cette technologie repose sur des données publiques et des partenariats avec des entreprises telles que Shutterstock. Cependant, la question de l’utilisation des données, parfois perçue comme non autorisée, reste un sujet sensible dans le secteur de l’IA.

Source : Les numériques