Guida ai prompt GPT Image 2: struttura, esempi e controllo dello stile
Guida pratica ai prompt per GPT Image 2 — struttura in sei parti, rendering testo multilingue, cinque brief testati e dove si colloca il modello nel 2026.

GPT Image 2 è il modello da scegliere quando la tipografia fa parte del deliverable. 2K nativo con upscaling 4K opzionale, accuratezza testo 95%+ su cinque script, reasoning su istruzioni stratificate e una superficie di editing in linguaggio naturale per rifinare un'immagine descrivendo la modifica. Questa guida è il playbook strutturale — template prompt in sei parti, cinque brief testati con prompt verbatim e l'elenco onesto di dove il modello resta indietro rispetto al campo.
Cos'è GPT Image 2
GPT Image 2 è nel workspace immagini OmniArt accanto a Nano Banana Pro, Seedream 5.0 Lite e il resto del roster immagini. È il più recente della linea immagini OpenAI, e quello che i creator usano davvero quando poster, segnaletica, grafiche slide, character sheet e mockup UI devono rendere la tipografia correttamente.
| Specifica | Valore |
|---|---|
| Risoluzione nativa | 2K (4K via upscale) |
| Accuratezza rendering testo | 95%+ multilingue (latino, cinese, giapponese, coreano, arabo) |
| Reasoning | Sì — interpretazione prompt stratificati |
| Editing in linguaggio naturale | Sì — descrivi la modifica, il modello edita |
| Range aspect ratio | da 3:1 a 1:3 |
| Tempo di generazione | 30–60 secondi tipici |
Dove guida, dove resta indietro
Una scorecard breve e onesta rispetto ai pari più vicini.
| Capacità | GPT Image 2 | Nano Banana Pro | Midjourney V8 |
|---|---|---|---|
| Risoluzione nativa | 2K (upscale 4K) | 4K | 2K (flag --hd) |
| Accuratezza testo | 95%+ multilingue | 94–96% | ~80% solo latino |
| Reasoning sui prompt | Sì | Limitato | No |
| Coerenza personaggio | Sequenziale pixel-level | Forte | Moderata |
| Editing linguaggio naturale | Sì | Limitato | No |
| Fotorealismo (pelle, luce) | Forte | Più forte | Forte |
| Granularità stile | Moderata | Moderata | Alta (pellicola, obiettivo) |
Il pattern: GPT Image 2 vince quando testo, reasoning o editing è il brief. Nano Banana Pro lo supera sui frame fotoreal puri. Midjourney vince ancora su lavoro ad alta direzione artistica dove stock pellicola e spec obiettivo fanno la differenza.
La struttura del prompt in sei parti
La struttura più pulita atterra bene su GPT Image 2.
[Stile / medium] + [soggetto] + [ambientazione] + [illuminazione] + [composizione] + [specifiche tecniche]
Leggendo uno dei migliori prompt di esempio in circolazione:
"Fotografia su pellicola 35mm, luce naturale calda da finestra. Una giovane donna seduta in una libreria vintage, legge un libro rilegato. Luce del pomeriggio morbida che filtra da finestre polverose, gettando luce dorata calda sulla scena. Piano medio, composizione leggermente decentrata con profondità di campo ridotta. Aspect ratio 3:4."
Quel singolo brief copre tutti e sei gli slot. La superficie di reasoning del modello ti permette di impaccare di più in un prompt rispetto ai concorrenti — ma la struttura resta la disciplina che trasforma «ho un'idea» in «è spedibile al primo tentativo».
Cinque abitudini che ripagano
- Scrivi in modo descrittivo, come un brief da regia. Le liste di keyword performano peggio delle frasi complete.
- Metti i dettagli importanti nelle prime 50 parole. Lo step di reasoning pesa di più i token iniziali.
- Usa vincoli negativi espliciti. «Nessun overlay testo, nessun watermark, nessun bordo» è più affidabile che sperare.
- Specifica l'aspect ratio. Il default è quadrato. Se ti serve 16:9 o 3:4, dillo.
- Itera in conversazione. Dopo la prima generazione, segui con edit mirati — «fai riflettere di più il pavimento, sposta la figura del 5% a destra» — invece di rigenerare da zero.
Cinque brief testati con prompt verbatim
Ogni prompt sotto l'abbiamo eseguito end-to-end. Usali come punto di partenza, non come stato finale.
1. Ritratto cinematografico
"Genera un ritratto cinematografico di una figura solitaria in un ambiente con gradiente intenso arancio-rosso. Illuminazione silhouette forte da dietro, contrasto ombra profondo, pavimento lucido riflettente che specchia la figura. Composizione simmetrica, set design minimale, nessun clutter di sfondo. Mood contemplativo e potente, come un fermo immagine di un film di Denis Villeneuve. Aspect ratio 16:9."
Cosa osservare: silhouette pulite, riflesso pavimento accurato, gradienti fluidi, postura ponderata.
2. Poster città con tipografia
"Un poster città Spring 2026 per New York con design contemporaneo audace e mood celebrativo elegante. Sfondo bianco sporco con texture e ampio spazio negativo. Un kayak in miniatura rema su un nastro stretto d'acqua riflettente nell'angolo in basso a destra. La scia sale in una curva calligrafica dinamica, si trasforma nell'Hudson e poi in un panorama dipinto a mano onirico di Manhattan. Dentro la composizione a forma di fiume: Empire State Building, Brooklyn Bridge, chioma di Central Park, One World Trade Center, tetti brownstone, taxi gialli, traghetti del porto e Statua della Libertà in lontananza morbida. Nebbia del mattino morbida, luce dorata primaverile, accenti navy e oro. Tipografia elegante in basso a sinistra «SPRING 2026» con slogan verticale «NEW YORK — A CITY OF BRIDGES, DREAMS, AND REINVENTION». Il testo deve essere nitido e ben composto. Graphic design premium, aspect ratio 9:16."
Cosa osservare: tipografia leggibile, flusso compositivo a S, landmark riconoscibili, spazio negativo intenzionale.
3. Character reference sheet
"Crea una character reference sheet professionale per un personaggio fantasy RPG originale: giovane maga con capelli argento e occhi viola, mantello scuro ornato con rune luminose. Su sfondo bianco pulito: turnaround tre viste fronte, lato e retro; variazioni espressione facciale neutra, sorriso, arrabbiata, sorpresa; breakdown dettagliato di costume e equipaggiamento; riga palette colori; note world-building in tipografia pulita. Layout a griglia organizzato, stile concept art, alta risoluzione. Aspect ratio 16:9."
Cosa osservare: design personaggio coerente tra le viste, espressioni varie, palette abbinata, etichette testo corrette.
4. Mockup UI / social media
"Screenshot iPhone iper-realistico di un profilo Instagram fittizio per Leonardo da Vinci, username @davinci_official, come se fosse un influencer moderno nel 2026. Foto profilo autoritratto rinascimentale in crop circolare. Bio: «Artist, Engineer, Inventor | Currently dissecting things | DM for commissions». La griglia mostra 9 post: la Gioconda come mirror selfie, uno schizzo di elicottero con didascalia «just dropped my new drone design», studio anatomico come foto progresso palestra, Ultima Cena come cena di gruppo, e altri mashup anacronistici creativi. Follower: 12,4M. Story highlights Sketches, Inventions, Florence Life. Barra di stato iOS completa con carrier «Renaissance 5G», icona batteria e ora corrente. UI dark mode. Qualità screenshot fotorealistica, aspect ratio 9:16."
Cosa osservare: elementi UI iOS accurati, didascalie leggibili, spaziatura griglia corretta, dettagli status bar funzionali.
5. Concept editoriale / sperimentale
"Dentro una mostra museale intitolata «Ancient Technology: The Desktop Era», un programmatore in teca di vetro dimostra live il coding su un monitor CRT mentre bambini delle scuole premono il naso sul vetro. La targhetta recita: «Homo Developerus (c. 2005) — Primitive human using keyboard-based input devices.» Una seconda teca mostra un libro fisico «Stack Overflow — Print Edition, Vol. 1 of 4,827». Stile illustrazione cartoon 2D, illuminazione museale calda, tono umoristico e nostalgico. Aspect ratio 16:9."
Cosa osservare: umorismo visivo nei dettagli, testo multilinea leggibile, stile illustrazione coeso.
Controllo dello stile: cosa funziona, cosa no
GPT Image 2 accetta direzione stile in linguaggio naturale meglio dello spam di keyword. Tre pattern che instradano in modo affidabile:
| Obiettivo | Direzione che funziona |
|---|---|
| Look cinematografico specifico | Riferisci un regista o film per nome («come un fermo Villeneuve») |
| Estetica print design | Nomina la tradizione tipografica («Swiss design», «bordo Art Deco») |
| Fotografia editoriale | Nomina medium e obiettivo («pellicola medium format», «obiettivo ritratto 85mm») |
Due pattern che non funzionano:
- Accumulare molti aggettivi di stile («dreamy ethereal cinematic photoreal hyperrealistic»). Il modello li media in melma.
- Chiedere un logo brand esatto. La riproduzione logo è inaffidabile; componi il logo in post.
Editing senza rigenerare
La superficie di edit in linguaggio naturale di GPT Image 2 è gran parte del valore una volta che il primo frame è giusto. Due pattern da conoscere:
- Edit mirati. «Sposta la sedia del 10% del frame a destra» funziona. «Rendilo migliore» no.
- Thread di iterazione. Ogni edit è un follow-up sull'output precedente. Mantieni il thread per coerenza personaggio o prodotto su uno shoot.
Limitazioni oneste
- La riproduzione logo è inaffidabile. Componi il logo esatto dopo.
- La velocità di generazione è 30–60 secondi. Più lento dei flagship da 5–10 secondi. Pianifica l'iterazione di conseguenza.
- I limiti del tier gratuito sono stretti. ~2 immagini/giorno sul free tier; Plus o API per produzione.
- Il controllo stile è meno granulare di Midjourney. Non puoi tarare stock pellicola e obiettivo con la stessa precisione.
- Policy contenuti più rigida. Più stretta delle alternative open source; alcuni brief che passano su Midjourney vengono rifiutati qui.
Tip
Per lavoro ad alto volume dove la tipografia è critica ma il resto dell'immagine no, renderizza il pass testo su GPT Image 2 e il pass fotografico su Nano Banana Pro, poi componi. Più economico e nitido che chiedere a entrambi i modelli di fare tutto.
Iniziare su OmniArt
GPT Image 2 è nel workspace immagini OmniArt accanto a Nano Banana Pro, Seedream 5.0 Lite, HappyHorse 1.0 e il resto. Stesso saldo crediti, stesso thread prompt, cambia modello e ri-renderizza per confrontare.
Inizia con il brief del ritratto cinematografico sopra per sentire la struttura, poi passa al brief del poster città quando vuoi testare la tipografia.
Per la decisione modello vs modello, il confronto GPT Image 2 vs Nano Banana 2 analizza sei round di brief testa a testa. Se stai scegliendo tra Seedream 5.0 Lite e GPT Image 2 per lavoro reasoning-heavy, la guida prompt Seedream 5.0 Lite copre quel lato del picker.