guideTutoriais e guias práticos9 min read
Journal · Tutoriais e guias práticos

Guia de prompts GPT Image 2: estrutura, exemplos e controle de estilo

Guia prático de prompts para GPT Image 2 — estrutura em seis partes, texto multilíngue, cinco briefs testados e onde o modelo se encaixa em 2026.

Equipe OmniArt·
Guia de prompts GPT Image 2: estrutura, exemplos e controle de estilo

O GPT Image 2 é o modelo certo quando tipografia faz parte da entrega. 2K nativo com upscale opcional para 4K, mais de 95% de precisão de texto em cinco scripts, raciocínio sobre instruções em camadas e superfície de edição em linguagem natural — você descreve a mudança e o modelo edita. Este guia é o playbook estrutural: template de prompt em seis partes, cinco briefs testados com prompts literais e a lista honesta de onde o modelo ainda fica atrás do mercado.

O que é o GPT Image 2

O GPT Image 2 fica no workspace de imagem da OmniArt ao lado do Nano Banana Pro, Seedream 5.0 Lite e o restante do roster. É o mais novo da linhagem de imagem da OpenAI — o que criadores usam de fato quando pôsteres, sinalização, gráficos de slide, character sheets e mockups de UI precisam acertar tipografia.

EspecificaçãoValor
Resolução nativa2K (4K via upscale)
Precisão de texto95%+ multilíngue (latino, chinês, japonês, coreano, árabe)
RaciocínioSim — interpretação de prompt em camadas
Edição em linguagem naturalSim — descreva a mudança
Faixa de aspect ratio3:1 a 1:3
Tempo de geração30–60 s típico

Onde lidera, onde fica atrás

Scorecard curto e honesto contra os pares mais próximos.

CapacidadeGPT Image 2Nano Banana ProMidjourney V8
Resolução nativa2K (upscale 4K)4K2K (flag --hd)
Precisão de texto95%+ multilíngue94–96%~80% só latim
Raciocínio sobre promptsSimLimitadoNão
Consistência de personagemSequencial pixel a pixelForteModerada
Edição em linguagem naturalSimLimitadaNão
Fotorrealismo (pele, luz)ForteMais forteForte
Granularidade de estiloModeradaModeradaAlta (filme, lente)

O padrão: GPT Image 2 vence quando texto, raciocínio ou edição são o brief. Nano Banana Pro ganha em frames fotorrealistas crus. Midjourney ainda vence em direção de arte muito estilizada onde filme e lente nomeados importam.

A estrutura de prompt em seis partes

A estrutura mais limpa encaixa bem no GPT Image 2.

[Estilo / meio] + [sujeito] + [ambiente / cenário] + [iluminação] + [composição] + [especificações técnicas]

Lendo um dos melhores exemplos:

"35mm film photography, warm natural window light. A young woman sitting in a vintage bookshop, reading a hardcover book. Soft afternoon sunlight filtering through dusty windows, casting warm golden light across the scene. Medium shot, slightly off-center composition with shallow depth of field. Aspect ratio 3:4."

Um único brief cobre os seis slots. A superfície de raciocínio permite empacotar mais que em modelos concorrentes — mas a estrutura continua sendo a disciplina que transforma «tenho uma ideia» em «isso shipa no primeiro try».

Cinco hábitos que valem a pena

  1. Escreva de forma descritiva, como brief de diretor. Listas de keywords performam pior que frases completas.
  2. Coloque o importante nas primeiras 50 palavras. O passo de raciocínio pesa tokens iniciais.
  3. Use restrições negativas explicitamente. «Sem overlay de texto, sem marca d'água, sem borda» é mais confiável que esperar.
  4. Especifique aspect ratio. O default é quadrado. Se precisa 16:9 ou 3:4, diga.
  5. Itere em conversa. Após a primeira geração, edite com instruções pontuais — «reflete mais no chão, empurra a figura 5% à direita» — em vez de regerar do zero.

Cinco briefs testados com prompts literais

Cada prompt abaixo rodamos ponta a ponta. Use como ponto de partida, não estado final.

1. Retrato cinematográfico

"Generate a cinematic portrait of a solitary figure standing in an intense orange-to-red gradient environment. Strong silhouette lighting from behind, deep shadow contrast, reflective glossy floor mirroring the figure. Symmetrical composition, minimal set design, no background clutter. The mood is contemplative and powerful, like a still from a Denis Villeneuve film. Aspect ratio 16:9."

Observe: silhuetas limpas, reflexo no chão, gradientes suaves, postura com peso.

2. Pôster de cidade com tipografia

"A striking Spring 2026 city poster for New York with a bold contemporary design and an elegant celebratory mood. Clean off-white textured background with generous negative space. A miniature kayaker paddles across a narrow ribbon of reflective water in the lower-right corner. The wake sweeps upward in a dynamic calligraphic curve, gradually transforming into the Hudson River and then into a dreamlike hand-painted panorama of Manhattan. Inside the flowing river-shaped composition: the Empire State Building, Brooklyn Bridge, Central Park canopy, One World Trade Center, brownstone rooftops, yellow cabs, harbor ferries, and the Statue of Liberty in soft distance. Soft morning fog, golden spring light, subtle accents in navy and gold. Elegant typography in the lower left reads 'SPRING 2026' with a vertical slogan 'NEW YORK — A CITY OF BRIDGES, DREAMS, AND REINVENTION'. Text must be sharp and beautifully composed. Premium graphic design, aspect ratio 9:16."

Observe: tipografia legível, fluxo em S, marcos reconhecíveis, negative space intencional.

3. Character reference sheet

"Create a professional character reference sheet for an original fantasy RPG character: a young female mage with silver hair and violet eyes, wearing an ornate dark cloak with glowing rune patterns. Include on a clean white background: a three-view turnaround showing front, side, and back; facial expression variations showing neutral, smiling, angry, and surprised; detailed breakdowns of costume and equipment pieces; a color palette swatch row; and brief world-building notes in clean typography. Organized grid layout, concept art style, high resolution. Aspect ratio 16:9."

Observe: design consistente entre vistas, expressões variadas, paleta alinhada, rótulos corretos.

4. Mockup de UI / rede social

"A hyper-realistic iPhone screenshot of a fictional Instagram profile page for Leonardo da Vinci, username @davinci_official, as if he were a modern influencer in 2026. Profile photo is a Renaissance self-portrait in a circle crop. Bio reads: 'Artist, Engineer, Inventor | Currently dissecting things | DM for commissions'. The grid shows 9 posts: the Mona Lisa reframed as a mirror selfie, a helicopter sketch captioned 'just dropped my new drone design', an anatomy study posted as a gym progress photo, The Last Supper staged as a dinner party group shot, and other creative anachronistic mashups. Follower count: 12.4M. Story highlights labeled Sketches, Inventions, and Florence Life. Complete iOS status bar with carrier text reading 'Renaissance 5G', battery icon, and current time. Dark mode UI throughout. Photorealistic screenshot quality, aspect ratio 9:16."

Observe: UI iOS precisa, legendas legíveis, grid espaçado, status bar funcional.

5. Conceito editorial / experimental

"Inside a museum exhibit titled 'Ancient Technology: The Desktop Era', a programmer in a glass display case is live-demonstrating coding on a CRT monitor while amazed schoolchildren press their faces against the glass. The exhibit placard reads: 'Homo Developerus (c. 2005) — Primitive human using keyboard-based input devices.' A second display case nearby shows a physical book labeled 'Stack Overflow — Print Edition, Vol. 1 of 4,827'. 2D cartoon illustration style, warm museum lighting, humorous and nostalgic tone. Aspect ratio 16:9."

Observe: humor visual no detalhe, texto multilinha legível, estilo de ilustração coeso.

Controle de estilo: o que funciona, o que não

O GPT Image 2 aceita direção de estilo em linguagem natural melhor que spam de keywords. Três padrões confiáveis:

ObjetivoDireção que funciona
Look cinematográfico específicoReferencie diretor ou filme («como um still de Villeneuve»)
Estética de design gráficoNomeie tradição tipográfica («design suíço», «borda Art Deco»)
Fotografia editorialNomeie meio e lente («filme médio formato», «lente 85mm retrato»)

Dois padrões que não funcionam:

  • Empilhar muitos adjetivos de estilo («dreamy ethereal cinematic photoreal hyperrealistic»). O modelo faz média e vira massa.
  • Pedir logo de marca exata. Reprodução de logo é instável; compõe o logo no pós.

Editar sem regerar

A superfície de edição em linguagem natural é grande parte do valor quando o primeiro frame está certo.

  • Edições pontuais. «Move a cadeira 10% à direita do frame» funciona. «Deixa melhor» não.
  • Threads de iteração. Cada edição segue a saída anterior. Mantenha o thread para consistência de personagem ou produto num shoot.

Limitações honestas

  • Logo é instável. Componha o logo exato depois.
  • Velocidade 30–60 s. Mais lento que flagships de 5–10 s. Planeje iteração.
  • Limites apertados no free tier. ~2 imagens/dia no free; Plus ou API para produção.
  • Menos granular que Midjourney em filme e lente.
  • Política de conteúdo mais rígida que alternativas open-source.

Tip

Em volume alto onde tipografia é crítica mas o resto da imagem não, renderize o passe de tipo no GPT Image 2 e o passe fotográfico no Nano Banana Pro, depois compõe. Mais barato e mais nítido que pedir os dois no mesmo modelo.

Começando na OmniArt

O GPT Image 2 está no workspace de imagem da OmniArt ao lado do Nano Banana Pro, Seedream 5.0 Lite, HappyHorse 1.0 e outros. Mesmo saldo de créditos, mesmo thread de prompt — troque o modelo e re-renderize para comparar.

Comece com o brief de retrato cinematográfico acima para sentir a estrutura, depois vá ao pôster de cidade quando quiser testar tipografia.

Para decisão modelo a modelo, a comparação GPT Image 2 vs Nano Banana 2 percorre seis rodadas head-to-head. Entre Seedream 5.0 Lite e GPT Image 2 para trabalho pesado em raciocínio, o guia Seedream 5.0 Lite cobre esse lado do picker.

Start creating

Pronto para criar?

Comece a gerar conteúdo incrível com IA