Guide prompt GPT Image 2 : structure, exemples et contrôle du style
Guide pratique pour GPT Image 2 — structure en six parties, rendu texte multilingue, cinq briefs testés et où le modèle se situe en 2026.

GPT Image 2 est le modèle à choisir quand la typographie fait partie de la livraison. 2K natif avec upscale 4K optionnel, 95 %+ de précision texte sur cinq scripts, raisonnement sur des instructions de prompt en couches et une surface d'édition en langage naturel qui permet d'affiner une image en décrivant le changement. Ce guide est le playbook structurel — le template de prompt en six parties, cinq briefs testés avec prompts verbatim et la liste honnête des domaines où le modèle reste en retrait.
Ce qu'est GPT Image 2
GPT Image 2 se trouve dans l'espace image OmniArt aux côtés de Nano Banana Pro, Seedream 5.0 Lite et du reste du roster image. C'est le plus récent de la lignée image OpenAI, et celui que les créateurs utilisent réellement quand affiches, signalétique, visuels slide, character sheets et maquettes UI doivent poser la typographie correctement.
| Spec | Valeur |
|---|---|
| Résolution native | 2K (4K via upscale) |
| Précision rendu texte | 95 %+ multilingue (Latin, chinois, japonais, coréen, arabe) |
| Raisonnement | Oui — interprétation de prompt en couches |
| Édition langage naturel | Oui — décrivez le changement, le modèle édite |
| Plage ratio | 3:1 à 1:3 |
| Temps de génération | 30–60 secondes typique |
Où il mène, où il traîne
Un scorecard court et honnête contre les pairs les plus proches.
| Capacité | GPT Image 2 | Nano Banana Pro | Midjourney V8 |
|---|---|---|---|
| Résolution native | 2K (upscale 4K) | 4K | 2K (flag --hd) |
| Précision texte | 95 %+ multilingue | 94–96 % | ~80 % Latin seulement |
| Raisonnement sur prompts | Oui | Limité | Non |
| Cohérence personnage | Séquentielle pixel-level | Forte | Modérée |
| Édition langage naturel | Oui | Limitée | Non |
| Photoréalisme (peau, lumière) | Fort | Plus fort | Fort |
| Granularité style | Modérée | Modérée | Haute (film stock, objectif) |
Le pattern : GPT Image 2 gagne quand texte, raisonnement ou édition est le brief. Nano Banana Pro le devance sur les frames photoréal brutes. Midjourney gagne encore sur le travail art direction très stylisé où film stocks nommés et specs objectif font vraiment le travail.
La structure de prompt en six parties
La structure la plus propre atterrit proprement sur GPT Image 2.
[Style / medium] + [sujet] + [environnement / décor] + [éclairage] + [composition] + [specs techniques]
En lisant l'un des meilleurs exemples de prompts :
"35mm film photography, warm natural window light. A young woman sitting in a vintage bookshop, reading a hardcover book. Soft afternoon sunlight filtering through dusty windows, casting warm golden light across the scene. Medium shot, slightly off-center composition with shallow depth of field. Aspect ratio 3:4."
Ce brief unique couvre les six slots. La surface de raisonnement du modèle permet d'en mettre plus dans un prompt que les modèles concurrents — mais la structure reste la discipline qui transforme « j'ai une idée » en « c'est livrable du premier coup ».
Cinq habitudes qui paient
- Écrivez de façon descriptive, comme un brief réalisateur. Les listes de mots-clés sous-performent les phrases complètes.
- Front-load les détails importants dans les 50 premiers mots. L'étape de raisonnement pondère plus fort les tokens précoces.
- Utilisez des contraintes négatives explicitement. « No text overlay, no watermark, no border » est plus fiable qu'espérer.
- Spécifiez le ratio. Le défaut est carré. Si vous avez besoin de 16:9 ou 3:4, dites-le.
- Itérez conversationnellement. Après la première génération, enchaînez avec des éditions ciblées — « make the floor reflect more, push the figure 5% to the right » — au lieu de régénérer from scratch.
Cinq briefs testés avec prompts verbatim
Chaque prompt ci-dessous est un que nous avons exécuté de bout en bout. Utilisez-les comme points de départ, pas comme état final.
1. Portrait cinématographique
"Generate a cinematic portrait of a solitary figure standing in an intense orange-to-red gradient environment. Strong silhouette lighting from behind, deep shadow contrast, reflective glossy floor mirroring the figure. Symmetrical composition, minimal set design, no background clutter. The mood is contemplative and powerful, like a still from a Denis Villeneuve film. Aspect ratio 16:9."
À surveiller : silhouettes propres, reflet sol précis, dégradés lisses, posture pondérée.
2. Affiche ville avec typographie
"A striking Spring 2026 city poster for New York with a bold contemporary design and an elegant celebratory mood. Clean off-white textured background with generous negative space. A miniature kayaker paddles across a narrow ribbon of reflective water in the lower-right corner. The wake sweeps upward in a dynamic calligraphic curve, gradually transforming into the Hudson River and then into a dreamlike hand-painted panorama of Manhattan. Inside the flowing river-shaped composition: the Empire State Building, Brooklyn Bridge, Central Park canopy, One World Trade Center, brownstone rooftops, yellow cabs, harbor ferries, and the Statue of Liberty in soft distance. Soft morning fog, golden spring light, subtle accents in navy and gold. Elegant typography in the lower left reads 'SPRING 2026' with a vertical slogan 'NEW YORK — A CITY OF BRIDGES, DREAMS, AND REINVENTION'. Text must be sharp and beautifully composed. Premium graphic design, aspect ratio 9:16."
À surveiller : typographie lisible, flux composition courbe en S, landmarks reconnaissables, negative space intentionnelle.
3. Character reference sheet
"Create a professional character reference sheet for an original fantasy RPG character: a young female mage with silver hair and violet eyes, wearing an ornate dark cloak with glowing rune patterns. Include on a clean white background: a three-view turnaround showing front, side, and back; facial expression variations showing neutral, smiling, angry, and surprised; detailed breakdowns of costume and equipment pieces; a color palette swatch row; and brief world-building notes in clean typography. Organized grid layout, concept art style, high resolution. Aspect ratio 16:9."
À surveiller : design personnage cohérent entre vues, expressions variées, palette couleur matching, labels texte corrects.
4. Maquette UI / réseaux sociaux
"A hyper-realistic iPhone screenshot of a fictional Instagram profile page for Leonardo da Vinci, username @davinci_official, as if he were a modern influencer in 2026. Profile photo is a Renaissance self-portrait in a circle crop. Bio reads: 'Artist, Engineer, Inventor | Currently dissecting things | DM for commissions'. The grid shows 9 posts: the Mona Lisa reframed as a mirror selfie, a helicopter sketch captioned 'just dropped my new drone design', an anatomy study posted as a gym progress photo, The Last Supper staged as a dinner party group shot, and other creative anachronistic mashups. Follower count: 12.4M. Story highlights labeled Sketches, Inventions, and Florence Life. Complete iOS status bar with carrier text reading 'Renaissance 5G', battery icon, and current time. Dark mode UI throughout. Photorealistic screenshot quality, aspect ratio 9:16."
À surveiller : éléments UI iOS précis, légendes lisibles, espacement grille correct, détails status bar fonctionnels.
5. Concept éditorial / expérimental
"Inside a museum exhibit titled 'Ancient Technology: The Desktop Era', a programmer in a glass display case is live-demonstrating coding on a CRT monitor while amazed schoolchildren press their faces against the glass. The exhibit placard reads: 'Homo Developerus (c. 2005) — Primitive human using keyboard-based input devices.' A second display case nearby shows a physical book labeled 'Stack Overflow — Print Edition, Vol. 1 of 4,827'. 2D cartoon illustration style, warm museum lighting, humorous and nostalgic tone. Aspect ratio 16:9."
À surveiller : humour visuel par le détail, texte multi-ligne lisible, style illustration cohérent.
Contrôle du style : ce qui marche, ce qui ne marche pas
GPT Image 2 prend mieux la direction style en langage naturel que le spam de mots-clés. Trois patterns qui routent de façon fiable :
| Objectif | Direction qui marche |
|---|---|
| Look cinématographique spécifique | Référencer un réalisateur ou film par nom (« like a Villeneuve still ») |
| Esthétique print-design | Nommer la tradition typographique (« Swiss design », « Art Deco border ») |
| Photographie éditoriale | Nommer le medium et l'objectif (« medium-format film », « 85mm portrait lens ») |
Deux patterns qui ne marchent pas :
- Empiler beaucoup d'adjectifs de style (« dreamy ethereal cinematic photoreal hyperrealistic »). Le modèle les moyenne en bouillie.
- Demander un logo de marque exact. La reproduction logo est peu fiable ; composez le logo en post.
Éditer sans régénérer
La surface d'édition langage naturel de GPT Image 2 est la majeure partie de la valeur une fois la première frame correcte. Deux patterns à connaître :
- Éditions ciblées. « Move the chair to the right by about 10% of the frame » marche. « Make it better » non.
- Threads d'itération. Chaque édition est un follow-up sur la sortie précédente. Gardez le thread pour la cohérence personnage ou produit sur un shoot.
Limites honnêtes
- La reproduction logo est peu fiable. Composez le logo exact après coup.
- La vitesse de génération est 30–60 secondes. Plus lent que les flagships 5–10 secondes. Planifiez l'itération en conséquence.
- Les limites rate free tier sont serrées. ~2 images/jour sur le free tier ; Plus ou API pour la production.
- Le contrôle style est moins granulaire que Midjourney. Impossible de régler film stock et objectif avec la même précision.
- Politique contenu plus stricte. Plus serrée que les alternatives open source ; certains briefs qui passent sur Midjourney sont refusés ici.
Tip
Pour le travail haut volume où la typographie est critique mais le reste de l'image ne l'est pas, rendez la passe type sur GPT Image 2 et la passe photo sur Nano Banana Pro, puis compositez. Moins cher et plus net que demander aux deux modèles de tout faire.
Commencer sur OmniArt
GPT Image 2 vit dans l'espace image OmniArt à côté de Nano Banana Pro, Seedream 5.0 Lite, HappyHorse 1.0 et le reste. Même solde crédits, même thread prompt, changez de modèle et re-render pour comparer.
Commencez avec le brief portrait cinématographique ci-dessus pour sentir la structure, puis passez au brief affiche ville une fois que vous voulez tester la typographie.
Pour la décision modèle vs modèle, la comparaison GPT Image 2 vs Nano Banana 2 parcourt six rounds de briefs head-to-head. Si vous choisissez entre Seedream 5.0 Lite et GPT Image 2 pour le travail reasoning-heavy, le guide prompt Seedream 5.0 Lite couvre ce côté du picker.