GPT Image 2プロンプトガイド:構造、例、スタイル制御
GPT Image 2実践プロンプトガイド——6部構造、多言語テキストレンダリング、5 tested brief、2026年でのモデル位置づけ。

GPT Image 2は、タイポグラフィが deliverable の一部のとき手を伸ばすモデルです。ネイティブ2K(任意4K upscale)、5スクリプト95%+テキスト精度、レイヤープロンプトへの推論、変更を記述する自然言語編集面。本ガイドは6部プロンプトテンプレート、 verbatim 5 brief、依然 trailing な領域の honest リストです。
GPT Image 2とは
OmniArt画像ワークスペースでNano Banana Pro、Seedream 5.0 Lite等と並存。OpenAI画像系最新で、ポスター、看板、スライドグラフィック、キャラシート、UI mockup で typography を正しく land させるとき実際に使われます。
| 仕様 | 値 |
|---|---|
| ネイティブ解像度 | 2K(upscaleで4K) |
| テキスト精度 | 5言語95%+(ラテン、中、日、韓、アラビア) |
| 推論 | あり——レイヤープロンプト解釈 |
| 自然言語編集 | あり——変更記述で編集 |
| アスペクト比 | 3:1〜1:3 |
| 生成時間 | 通常30〜60秒 |
リードと trailing
closest peer への honest scorecard。
| 能力 | GPT Image 2 | Nano Banana Pro | Midjourney V8 |
|---|---|---|---|
| ネイティブ解像度 | 2K(4K upscale) | 4K | 2K(--hd) |
| テキスト精度 | 5言語95%+ | 94〜96% | ラテン約80% |
| プロンプト推論 | あり | 限定的 | なし |
| キャラ一貫性 | ピクセル級 sequential | 強い | 中程度 |
| 自然言語編集 | あり | 限定的 | なし |
| フォトリアリズム | 強い | より強い | 強い |
| スタイル粒度 | 中程度 | 中程度 | 高(フィルム、レンズ) |
パターン:テキスト・推論・編集 brief で GPT Image 2。生フレームフォトリアルは Nano Banana Pro が edge。高度スタイライズアートディレクション(命名フィルム stock・レンズ spec)は Midjourney。
6部プロンプト構造
cleanest structure が clean land。
[スタイル/媒体] + [被写体] + [環境/設定] + [照明] + [構図] + [技術 spec]
wild 例から:
「35mmフィルム写真、暖かい自然窓光。ヴィンテージ書店でハードカバーを読む若い女性。埃っぽい窓越し午後の柔らかい日光、暖かい黄金光。ミディアムショット、やや off-center、浅い被写界深度。アスペクト比3:4。」
1 brief で6 slot すべて。推論面で competing より1プロンプトに pack 可——構造は「アイデア」から「初回 shippable」への discipline。
5習慣
- 監督 brief のように記述。 キーワードリストは full sentence に underperform。
- 最初50語に重要詳細。 推論 step は early token を heavy weight。
- ** negative 制約明示。** 「テキスト overlay なし、 watermark なし、 border なし」。
- アスペクト比指定。 default 正方形。16:9 や 3:4 なら明記。
- 会話的 iterate。 初回後 targeted edit——「床反射を増やし、人物をフレーム右5%」—— scratch 再生成より。
verbatim 5 brief
end-to-end 実行済み。起点として使い final 状態にしない。
1. シネマティック肖像
「Generate a cinematic portrait of a solitary figure standing in an intense orange-to-red gradient environment. Strong silhouette lighting from behind, deep shadow contrast, reflective glossy floor mirroring the figure. Symmetrical composition, minimal set design, no background clutter. The mood is contemplative and powerful, like a still from a Denis Villeneuve film. Aspect ratio 16:9.」
Watch for: clean silhouette、正確床反射、 smooth gradient、 weighted posture。
2. タイポグラフィ付き都市ポスター
「A striking Spring 2026 city poster for New York with a bold contemporary design and an elegant celebratory mood. Clean off-white textured background with generous negative space. A miniature kayaker paddles across a narrow ribbon of reflective water in the lower-right corner. The wake sweeps upward in a dynamic calligraphic curve, gradually transforming into the Hudson River and then into a dreamlike hand-painted panorama of Manhattan. Inside the flowing river-shaped composition: the Empire State Building, Brooklyn Bridge, Central Park canopy, One World Trade Center, brownstone rooftops, yellow cabs, harbor ferries, and the Statue of Liberty in soft distance. Soft morning fog, golden spring light, subtle accents in navy and gold. Elegant typography in the lower left reads 'SPRING 2026' with a vertical slogan 'NEW YORK — A CITY OF BRIDGES, DREAMS, AND REINVENTION'. Text must be sharp and beautifully composed. Premium graphic design, aspect ratio 9:16.」
Watch for: 可読 typography、S-curve flow、 recognizable landmark、意図的余白。
3. キャラクター参照シート
「Create a professional character reference sheet for an original fantasy RPG character: a young female mage with silver hair and violet eyes, wearing an ornate dark cloak with glowing rune patterns. Include on a clean white background: a three-view turnaround showing front, side, and back; facial expression variations showing neutral, smiling, angry, and surprised; detailed breakdowns of costume and equipment pieces; a color palette swatch row; and brief world-building notes in clean typography. Organized grid layout, concept art style, high resolution. Aspect ratio 16:9.」
Watch for: view 間一貫デザイン、 varied expression、 matching palette、正しい label。
4. UI/SNS mockup
「A hyper-realistic iPhone screenshot of a fictional Instagram profile page for Leonardo da Vinci, username @davinci_official, as if he were a modern influencer in 2026. Profile photo is a Renaissance self-portrait in a circle crop. Bio reads: 'Artist, Engineer, Inventor | Currently dissecting things | DM for commissions'. The grid shows 9 posts: the Mona Lisa reframed as a mirror selfie, a helicopter sketch captioned 'just dropped my new drone design', an anatomy study posted as a gym progress photo, The Last Supper staged as a dinner party group shot, and other creative anachronistic mashups. Follower count: 12.4M. Story highlights labeled Sketches, Inventions, and Florence Life. Complete iOS status bar with carrier text reading 'Renaissance 5G', battery icon, and current time. Dark mode UI throughout. Photorealistic screenshot quality, aspect ratio 9:16.」
Watch for: 正確 iOS UI、可読 caption、 grid spacing、 status bar。
5. エディトリアル/実験コンセプト
「Inside a museum exhibit titled 'Ancient Technology: The Desktop Era', a programmer in a glass display case is live-demonstrating coding on a CRT monitor while amazed schoolchildren press their faces against the glass. The exhibit placard reads: 'Homo Developerus (c. 2005) — Primitive human using keyboard-based input devices.' A second display case nearby shows a physical book labeled 'Stack Overflow — Print Edition, Vol. 1 of 4,827'. 2D cartoon illustration style, warm museum lighting, humorous and nostalgic tone. Aspect ratio 16:9.」
Watch for: 詳細による humor、可読 multi-line text、 cohesive illustration。
スタイル制御:効く/効かない
自然言語スタイル指示は keyword spam より良い。3 reliable pattern:
| 目標 | 効く指示 |
|---|---|
| 特定シネマ look | 監督・映画名(「Villeneuve still のように」) |
| 印刷デザイン aesthetic | タイポ伝統(「スイスデザイン」「Art Deco枠」) |
| エディトリアル写真 | 媒体とレンズ(「中判フィルム」「85mm portrait」) |
効かない2 pattern:
- 多数スタイル形容詞 stack(「dreamy ethereal cinematic photoreal hyperrealistic」)→ mush に平均化。
- 正確ブランドロゴ要求—— reproduction unreliable; post で composite。
再生成なし編集
自然言語 edit 面が初回フレームが right のあとの大部分の価値。
- Targeted edit。 「椅子をフレーム幅約10%右へ」は可。「もっと良く」は不可。
- Iteration thread。 各 edit は前出力 follow-up。 shoot 間キャラ・product 一貫性に thread 維持。
honest 限界
- ロゴ reproduction unreliable。 正確ロゴは後 composite。
- 30〜60秒。 5〜10秒 flagship より遅。 iterate 計画 accordingly。
- 無料 tier rate limit 厳しい。 約2枚/日; production は Plus/API。
- Midjourney よりスタイル粒度低。 フィルム stock・レンズ dial 精度低。
- より厳しい content policy。 Midjourney pass する brief が refuse されることあり。
Tip
typography critical で rest がそこまででない high-volume work では、 type pass を GPT Image 2、 photographic pass を Nano Banana Pro、 composite。どちらか両方より安く sharp。
OmniArtでの始め方
GPT Image 2はNano Banana Pro、Seedream 5.0 Lite、HappyHorse 1.0等と並存。同残高、同スレッド、モデル切替 compare。
上シネマティック肖像で構造体感後、 typography テストで都市ポスター brief。
モデル対決はGPT Image 2 vs Nano Banana 2。Seedream 5.0 Lite との推論 heavy 選択はSeedream 5.0 Liteプロンプトガイド。