Le modèle de génération d'images le plus avancé d'OpenAI avec Thinking Mode natif, plus de 95 % de précision de rendu texte, recherche web pendant la génération et prise en charge de jusqu'à 16 images de référence. Générez des visuels prêts pour la production avec une typographie précise, des personnages cohérents et un support multilingue.
GPT Image 2 (ChatGPT Images 2.0) est le dernier modèle d'image d'OpenAI, lancé en avril 2026 en tant que successeur de la génération d'images GPT-4o. C'est le premier modèle d'image OpenAI doté d'un raisonnement intégré, atteignant plus de 95 % de précision de rendu texte pour les écritures latines et non latines. Le modèle prend en charge la résolution 2K, les rapports d'aspect continus de 3:1 à 1:3 et génère jusqu'à 8 images cohérentes à partir d'une seule invite. Avec Thinking Mode, il peut effectuer des recherches web pendant la génération, analyser des guides de marque téléchargés et auto-vérifier les résultats avant le rendu.

Premier modèle d'image OpenAI avec raisonnement intégré. Effectue des recherches web, analyse des documents téléchargés comme des PDFs et des guides de marque, raisonne sur la mise en page avant de dessiner et auto-vérifie les résultats avant de les restituer.
Une avancée majeure dans le rendu texte qui traite la typographie comme un élément de premier ordre. Titres nets, légendes petites mais lisibles, SKUs et prix précis — plus de texte illisible dans vos générations.
Rendu texte de qualité native en japonais, coréen, chinois, hindi, bengali et toutes les écritures latines. Gestion des écritures mixtes pour les supports marketing mondiaux, menus et créations internationales.
Téléchargez jusqu'à 16 images de référence pour la cohérence des personnages, la fidélité des détails produits, la fusion multi-éléments et l'alignement stylistique sur l'ensemble des sorties générées.
Résolution de sortie jusqu'à 2048x2048 (2K) avec prise en charge de rapports d'aspect continus de 3:1 ultra-large à 1:3 ultra-haut. Fini les formats prédéfinis — spécifiez le rapport dont vous avez besoin.
Générez jusqu'à 8 images cohérentes à partir d'une seule invite avec des personnages, objets et éclairages constants sur l'ensemble du lot — idéal pour les storyboards, variations et production en série.
GPT Image 2 FAQ
GPT Image 2 (ChatGPT Images 2.0) est le dernier modèle de génération d'images d'OpenAI, lancé en avril 2026. Contrairement à DALL-E 3, il dispose d'un Thinking Mode natif avec raisonnement, de plus de 95 % de précision de rendu texte, de la recherche web pendant la génération, de jusqu'à 16 images de référence, de la résolution 2K et du support texte multilingue pour le japonais, le coréen, le chinois, l'hindi et le bengali.
Thinking Mode ajoute une étape de raisonnement avant la génération d'images. Le modèle peut rechercher sur le web des références actuelles, analyser des documents téléchargés comme des PDFs et guides de marque, planifier la mise en page et la composition, puis auto-vérifier les résultats avant le rendu. Cela prend jusqu'à 2 minutes pour les invites complexes mais produit des résultats nettement supérieurs pour les demandes créatives conformes à la marque, riches en informations ou en plusieurs étapes.
GPT Image 2 atteint plus de 95 % de précision de rendu texte dans toutes les écritures supportées, contre environ 60 à 70 % pour les modèles précédents. Les titres, petites légendes, SKUs, prix et étiquettes suivent précisément les invites. C'est le premier modèle d'image IA où le rendu texte est suffisamment fiable pour une utilisation en production.
GPT Image 2 offre un rendu texte de qualité native en japonais, coréen, chinois (simplifié et traditionnel), hindi, bengali et toutes les écritures latines, y compris l'anglais, le français, l'allemand, l'espagnol et plus encore. Il gère le contenu en écritures mixtes en une seule génération.
GPT Image 2 prend en charge jusqu'à 16 images de référence en une seule requête. Les références sont automatiquement traitées en haute fidélité sans avoir à ajuster de paramètres séparés. Cela permet de maintenir la cohérence des personnages, les détails des produits et le style visuel sur l'ensemble des sorties générées.
GPT Image 2 prend en charge une résolution de sortie jusqu'à 2048x2048 (2K), avec des rapports d'aspect continus de 3:1 (ultra-large) à 1:3 (ultra-haut). Contrairement aux modèles précédents avec des formats prédéfinis, vous pouvez spécifier n'importe quel rapport dans cette plage. Il supporte également les exports sur fond transparent pour une intégration directe dans les pipelines.
GPT Image 2 utilise une tarification basée sur les tokens. En résolution standard 1024x1024, les coûts vont d'environ 0,006 $ par image (basse qualité) à 0,211 $ par image (haute qualité). Les tokens d'entrée coûtent 8 $ par million et les tokens de sortie 30 $ par million. L'ID du modèle est 'gpt-image-2' avec un alias de mise à jour automatique 'chatgpt-image-latest'.
Oui. Le Thinking Mode de GPT Image 2 peut calculer le codage du code QR avant le rendu, produisant des codes QR fonctionnels qui se scannent avec n'importe quel appareil photo. Vous pouvez les personnaliser avec les couleurs de la marque, intégrer des logos au centre et les placer dans des affiches entièrement conçues — condensant trois étapes en une seule invite.
Oui. Vous pouvez télécharger des images existantes et les modifier via des invites en langage naturel dans le même chat. Cela inclut le transfert de style, le remplacement d'éléments, l'amélioration des détails, les mises à jour de mise en page et le fusionnement multi-images. Les workflows texte-vers-image et image-vers-image sont tous deux supportés sur un seul endpoint.
GPT Image 2 est idéal pour les équipes marketing créant des bannières publicitaires et des graphiques pour réseaux sociaux, les vendeurs e-commerce produisant des catalogues produits, les designers travaillant sur des infographies et présentations, les créateurs de contenu réalisant des miniatures et affiches, les artistes manga ayant besoin de personnages cohérents avec des bulles de dialogue lisibles, et toute personne ayant besoin d'images IA de qualité professionnelle avec du texte précis.
“Le rendu texte à lui seul vaut la mise à niveau. Je peux enfin générer des maquettes produits avec des étiquettes et des prix précis en une seule fois, sans avoir à ajouter du texte dans Photoshop après coup.”
“Utiliser 16 images de référence pour la photographie produit signifie que chaque article de notre catalogue a un éclairage et un style cohérents. Nous avons réduit les coûts de séances photo de 80 %.”
“Le rendu texte à lui seul vaut la mise à niveau. Je peux enfin générer des maquettes produits avec des étiquettes et des prix précis en une seule fois, sans avoir à ajouter du texte dans Photoshop après coup.”
“Utiliser 16 images de référence pour la photographie produit signifie que chaque article de notre catalogue a un éclairage et un style cohérents. Nous avons réduit les coûts de séances photo de 80 %.”
“Le rendu texte à lui seul vaut la mise à niveau. Je peux enfin générer des maquettes produits avec des étiquettes et des prix précis en une seule fois, sans avoir à ajouter du texte dans Photoshop après coup.”
“Utiliser 16 images de référence pour la photographie produit signifie que chaque article de notre catalogue a un éclairage et un style cohérents. Nous avons réduit les coûts de séances photo de 80 %.”
“Le rendu texte à lui seul vaut la mise à niveau. Je peux enfin générer des maquettes produits avec des étiquettes et des prix précis en une seule fois, sans avoir à ajouter du texte dans Photoshop après coup.”
“Utiliser 16 images de référence pour la photographie produit signifie que chaque article de notre catalogue a un éclairage et un style cohérents. Nous avons réduit les coûts de séances photo de 80 %.”
Découvrez GPT Image 2 — le générateur d'images IA le plus avancé d'OpenAI, gratuitement
Glissez-déposez des images de référence ou parcourir les fichiers
Formats pris en charge: JPG, PNG, WEBP • MAX 10MB