guideTutoriais e guias práticos9 min de leitura

Guia de prompts GPT Image 2: estrutura, exemplos e controle de estilo

Guia prático de prompts para GPT Image 2 — estrutura em seis partes, texto multilíngue, cinco briefs testados e onde o modelo se encaixa em 2026.

Equipe OmniArt1 de mai. de 2026

O GPT Image 2 é o modelo certo quando tipografia faz parte da entrega. 2K nativo com upscale opcional para 4K, mais de 95% de precisão de texto em cinco scripts, raciocínio sobre instruções em camadas e superfície de edição em linguagem natural — você descreve a mudança e o modelo edita. Este guia é o playbook estrutural: template de prompt em seis partes, cinco briefs testados com prompts literais e a lista honesta de onde o modelo ainda fica atrás do mercado.

O que é o GPT Image 2

O GPT Image 2 fica no workspace de imagem da OmniArt ao lado do Nano Banana Pro, Seedream 5.0 Lite e o restante do roster. É o mais novo da linhagem de imagem da OpenAI — o que criadores usam de fato quando pôsteres, sinalização, gráficos de slide, character sheets e mockups de UI precisam acertar tipografia.

Especificação	Valor
Resolução nativa	2K (4K via upscale)
Precisão de texto	95%+ multilíngue (latino, chinês, japonês, coreano, árabe)
Raciocínio	Sim — interpretação de prompt em camadas
Edição em linguagem natural	Sim — descreva a mudança
Faixa de aspect ratio	3:1 a 1:3
Tempo de geração	30–60 s típico

Onde lidera, onde fica atrás

Scorecard curto e honesto contra os pares mais próximos.

Capacidade	GPT Image 2	Nano Banana Pro	Midjourney V8
Resolução nativa	2K (upscale 4K)	4K	2K (flag `--hd`)
Precisão de texto	95%+ multilíngue	94–96%	~80% só latim
Raciocínio sobre prompts	Sim	Limitado	Não
Consistência de personagem	Sequencial pixel a pixel	Forte	Moderada
Edição em linguagem natural	Sim	Limitada	Não
Fotorrealismo (pele, luz)	Forte	Mais forte	Forte
Granularidade de estilo	Moderada	Moderada	Alta (filme, lente)

O padrão: GPT Image 2 vence quando texto, raciocínio ou edição são o brief. Nano Banana Pro ganha em frames fotorrealistas crus. Midjourney ainda vence em direção de arte muito estilizada onde filme e lente nomeados importam.

A estrutura de prompt em seis partes

A estrutura mais limpa encaixa bem no GPT Image 2.

[Estilo / meio] + [sujeito] + [ambiente / cenário] + [iluminação] + [composição] + [especificações técnicas]

Lendo um dos melhores exemplos:

"35mm film photography, warm natural window light. A young woman sitting in a vintage bookshop, reading a hardcover book. Soft afternoon sunlight filtering through dusty windows, casting warm golden light across the scene. Medium shot, slightly off-center composition with shallow depth of field. Aspect ratio 3:4."

Um único brief cobre os seis slots. A superfície de raciocínio permite empacotar mais que em modelos concorrentes — mas a estrutura continua sendo a disciplina que transforma «tenho uma ideia» em «isso shipa no primeiro try».

Cinco hábitos que valem a pena

Escreva de forma descritiva, como brief de diretor. Listas de keywords performam pior que frases completas.
Coloque o importante nas primeiras 50 palavras. O passo de raciocínio pesa tokens iniciais.
Use restrições negativas explicitamente. «Sem overlay de texto, sem marca d'água, sem borda» é mais confiável que esperar.
Especifique aspect ratio. O default é quadrado. Se precisa 16:9 ou 3:4, diga.
Itere em conversa. Após a primeira geração, edite com instruções pontuais — «reflete mais no chão, empurra a figura 5% à direita» — em vez de regerar do zero.

Cinco briefs testados com prompts literais

Cada prompt abaixo rodamos ponta a ponta. Use como ponto de partida, não estado final.

1. Retrato cinematográfico

"Generate a cinematic portrait of a solitary figure standing in an intense orange-to-red gradient environment. Strong silhouette lighting from behind, deep shadow contrast, reflective glossy floor mirroring the figure. Symmetrical composition, minimal set design, no background clutter. The mood is contemplative and powerful, like a still from a Denis Villeneuve film. Aspect ratio 16:9."

Observe: silhuetas limpas, reflexo no chão, gradientes suaves, postura com peso.

2. Pôster de cidade com tipografia

"A striking Spring 2026 city poster for New York with a bold contemporary design and an elegant celebratory mood. Clean off-white textured background with generous negative space. A miniature kayaker paddles across a narrow ribbon of reflective water in the lower-right corner. The wake sweeps upward in a dynamic calligraphic curve, gradually transforming into the Hudson River and then into a dreamlike hand-painted panorama of Manhattan. Inside the flowing river-shaped composition: the Empire State Building, Brooklyn Bridge, Central Park canopy, One World Trade Center, brownstone rooftops, yellow cabs, harbor ferries, and the Statue of Liberty in soft distance. Soft morning fog, golden spring light, subtle accents in navy and gold. Elegant typography in the lower left reads 'SPRING 2026' with a vertical slogan 'NEW YORK — A CITY OF BRIDGES, DREAMS, AND REINVENTION'. Text must be sharp and beautifully composed. Premium graphic design, aspect ratio 9:16."

Observe: tipografia legível, fluxo em S, marcos reconhecíveis, negative space intencional.

3. Character reference sheet

"Create a professional character reference sheet for an original fantasy RPG character: a young female mage with silver hair and violet eyes, wearing an ornate dark cloak with glowing rune patterns. Include on a clean white background: a three-view turnaround showing front, side, and back; facial expression variations showing neutral, smiling, angry, and surprised; detailed breakdowns of costume and equipment pieces; a color palette swatch row; and brief world-building notes in clean typography. Organized grid layout, concept art style, high resolution. Aspect ratio 16:9."

Observe: design consistente entre vistas, expressões variadas, paleta alinhada, rótulos corretos.

"A hyper-realistic iPhone screenshot of a fictional Instagram profile page for Leonardo da Vinci, username @davinci_official, as if he were a modern influencer in 2026. Profile photo is a Renaissance self-portrait in a circle crop. Bio reads: 'Artist, Engineer, Inventor | Currently dissecting things | DM for commissions'. The grid shows 9 posts: the Mona Lisa reframed as a mirror selfie, a helicopter sketch captioned 'just dropped my new drone design', an anatomy study posted as a gym progress photo, The Last Supper staged as a dinner party group shot, and other creative anachronistic mashups. Follower count: 12.4M. Story highlights labeled Sketches, Inventions, and Florence Life. Complete iOS status bar with carrier text reading 'Renaissance 5G', battery icon, and current time. Dark mode UI throughout. Photorealistic screenshot quality, aspect ratio 9:16."

Observe: UI iOS precisa, legendas legíveis, grid espaçado, status bar funcional.

5. Conceito editorial / experimental

"Inside a museum exhibit titled 'Ancient Technology: The Desktop Era', a programmer in a glass display case is live-demonstrating coding on a CRT monitor while amazed schoolchildren press their faces against the glass. The exhibit placard reads: 'Homo Developerus (c. 2005) — Primitive human using keyboard-based input devices.' A second display case nearby shows a physical book labeled 'Stack Overflow — Print Edition, Vol. 1 of 4,827'. 2D cartoon illustration style, warm museum lighting, humorous and nostalgic tone. Aspect ratio 16:9."

Observe: humor visual no detalhe, texto multilinha legível, estilo de ilustração coeso.

Controle de estilo: o que funciona, o que não

O GPT Image 2 aceita direção de estilo em linguagem natural melhor que spam de keywords. Três padrões confiáveis:

Objetivo	Direção que funciona
Look cinematográfico específico	Referencie diretor ou filme («como um still de Villeneuve»)
Estética de design gráfico	Nomeie tradição tipográfica («design suíço», «borda Art Deco»)
Fotografia editorial	Nomeie meio e lente («filme médio formato», «lente 85mm retrato»)

Dois padrões que não funcionam:

Empilhar muitos adjetivos de estilo («dreamy ethereal cinematic photoreal hyperrealistic»). O modelo faz média e vira massa.
Pedir logo de marca exata. Reprodução de logo é instável; compõe o logo no pós.

Editar sem regerar

A superfície de edição em linguagem natural é grande parte do valor quando o primeiro frame está certo.

Edições pontuais. «Move a cadeira 10% à direita do frame» funciona. «Deixa melhor» não.
Threads de iteração. Cada edição segue a saída anterior. Mantenha o thread para consistência de personagem ou produto num shoot.

Limitações honestas

Logo é instável. Componha o logo exato depois.
Velocidade 30–60 s. Mais lento que flagships de 5–10 s. Planeje iteração.
Limites apertados no free tier. ~2 imagens/dia no free; Plus ou API para produção.
Menos granular que Midjourney em filme e lente.
Política de conteúdo mais rígida que alternativas open-source.

Dica

Em volume alto onde tipografia é crítica mas o resto da imagem não, renderize o passe de tipo no GPT Image 2 e o passe fotográfico no Nano Banana Pro, depois compõe. Mais barato e mais nítido que pedir os dois no mesmo modelo.

Começando na OmniArt

O GPT Image 2 está no workspace de imagem da OmniArt ao lado do Nano Banana Pro, Seedream 5.0 Lite, HappyHorse 1.0 e outros. Mesmo saldo de créditos, mesmo thread de prompt — troque o modelo e re-renderize para comparar.

Comece com o brief de retrato cinematográfico acima para sentir a estrutura, depois vá ao pôster de cidade quando quiser testar tipografia.

Para decisão modelo a modelo, a comparação GPT Image 2 vs Nano Banana 2 percorre seis rodadas head-to-head. Entre Seedream 5.0 Lite e GPT Image 2 para trabalho pesado em raciocínio, o guia Seedream 5.0 Lite cobre esse lado do picker.

Pronto para criar?

Comece a gerar conteúdo incrível com IA

Começar grátis