商品写真から動画へ:OmniArtのAIワークフロー実践ガイド
OmniArtで今すぐ使えるモデルだけで、商品写真1枚をスクロールを止める動画に変換。Geminiがプレビューしたのと同じ写真から動画へのパイプラインを解説します。

6月30日、GoogleはGemini内で新しい組み合わせを披露しました。高速な画像編集向けのNano Banana 2 Liteと、短尺動画生成向けのGemini Omni Flashを、Interactions API経由でチェイニングするというものです。目玉のデモであるOmni Product Studioでは、1枚の静止した商品写真を、クリーンなEコマース向けショットへと編集し、そのショットを短い動画へとアニメーション化するところまでを、一つのパイプラインで完結させていました。Googleは同じ構造をさらに2回披露しています。「Anywhere」(写真を新しいロケーションに配置してから動きを与える)と、「Space Lift」(インテリアデザインの静止画をシネマティックなウォークスルーに変える)です。3つに共通するパターンは、まず画像を編集し、それを動画モデルに渡すという流れです。
このワークフローを実践するのに、Googleの特定のパイプラインは必要ありません。OmniArtには既に、重要な2つの要素が揃っています。この種の編集パスのために作られた画像モデルと、静止画を動きへと変える動画ラインナップです。以下では、同じ写真から動画への流れを、準備・編集・アニメーション化・書き出しまで一貫して、OmniArtで今すぐ利用できることが確認されているモデルを使って解説します。各ステップのサンプルプロンプトも掲載しています。
OmniArtで今すぐ利用できるもの
Nano Banana 2 Liteは登場したばかりの新モデルで、Gemini Omni Flashの開発者向けAPIとそのチェイニング連携もちょうど公開されたところです。どちらもまだOmniArtのワークスペースには組み込まれておらず、このチュートリアルでは、これらの利用を前提にはしません。今すぐ使えるのは、画像編集ステップ向けのNano Banana 2(新しいLiteティアではありません)で、画像モデル選択メニューで「新着」「注目」タグが付いています。また、アニメーション化ステップ向けには、ここで組み合わせるSeedance 2.0を含む、フルラインナップの動画モデルが使えます。以下のプロンプトはすべて、今日開けるモデルの上で動作します。
ヒント
Googleの「Omni Product Studio」の組み合わせ——編集にNano Banana 2 Lite(1K解像度の画像1枚あたり$0.034、約4秒)、アニメーション化にGemini Omni Flash(1秒あたり$0.10、10秒上限)を、Interactions API経由でチェイニングする構成——は、以下のワークフローを専用に作り込んだバージョンです。どちらのモデルもまだOmniArtのワークスペースにはなく、OmniArtは両方を評価中です。導入された後も、この手順自体は変わりません。より速く、より安くなるだけです。背景については、Gemini Omni Flashの開発者向けAPI公開:I/O以降の変更点まとめと、Nano Banana 2 Lite vs 2 vs Pro:Geminiのどのモデルを使うべきかをご覧ください。
必要なもの
- 商品写真1枚——自分で撮影したものでも、クリーンなカタログ写真でも構いません
- 画像・動画ワークスペースにアクセスできるOmniArtアカウント
- 編集ステップ用のNano Banana 2
- アニメーション化ステップ用の動画モデル——本ガイドでは、参照システムが動きの中でも商品の形状と色をどれだけしっかり保持できるかという理由から、Seedance 2.0を使用します
- 任意:書き出し前のサウンド仕上げ用に、OmniArtのオーディオモデル
| ステップ | ワークスペース | モデル | 内容 |
|---|---|---|---|
| 1 | — | — | クリーンな商品写真を撮影または用意する |
| 2 | 画像 | Nano Banana 2 | 背景のクリーンアップ、ステージング、ライフスタイルバリエーション |
| 3 | 動画 | Seedance 2.0 | 編集済みの写真を短いクリップにアニメーション化する |
| 4 | 動画 | Seedance 2.0 | シードバリエーション間で一貫性を固定する |
| 5 | オーディオ+書き出し | — | サウンド仕上げとプラットフォーム向け書き出し |
ステップ1:クリーンな商品写真を撮影または用意する
編集とアニメーション化のステップは、最初のフレームに既に写っているものでしか作業できません。そのため、ここでの数分の準備が、後で二重に報われます。
- 無地で均一な照明の背景。 白、グレー、またはシームレス紙——Nano Banana 2は、ごちゃついた背景よりもシンプルな土台のほうが、よりクリーンに編集できます。
- 拡散光。 強い影や白飛びした反射は、商品が動き出した瞬間に動画モデルが最も歪めやすい部分です。
- フレームいっぱいに写す。 商品を最も目立つ被写体として保ちましょう。動画モデルは、最初のフレームで最も視覚的な比重が大きいものに追従します。
- 最も正面に近く、代表的なアングルで撮影する。 それが最初のフレームになり、以降のすべてのフレームがそれと比較されます。
- 手元にある最高の解像度を使う。 元の画素数が多いほど、ラベルや細部のディテールが両方のステップを通じてより崩れにくくなります。
新規撮影ではなく、既存のカタログ写真から始める場合も、同じルールが適用されます。ステップ2に進む前に、強い影を均し、余計なものをクロップして取り除いてください。Nano Banana 2は新しい商品を作り出すのではなく、既にそこにあるものを編集するモデルだからです。
ステップ2:Nano Banana 2で写真を編集・ステージングする
OmniArtの画像ワークスペースでNano Banana 2を開き、元の写真を参照画像としてアップロードします。ゼロから新しいシーンを記述するのではなく、その写真を編集するという発想です。ここはGoogleのデモからそのまま借りる価値がある部分で、画像ステップは的を絞った編集であるべきです。Nano Banana 2は、時間のかかる最大限のレンダリングよりも、高速でバランスの取れた編集に向けて調整されており、1枚のヒーローショットではなく、商品ごとに数パターンのステージングバリエーションを生成する用途に適しています。
実行する価値のある2つのプロンプトを紹介します。
クリーンなスタジオ背景:
「この参照写真を編集してください。背景をシームレスなソフトライラックグレーのスタジオ背景に置き換えます。商品の形状・プロポーション・色・ラベルのテキストは、参照写真のまま正確に保ってください。左上からの柔らかい拡散スタジオ照明と、下の面にうっすらとした反射を加えてください。商品自体は変更しないでください。」
ライフスタイルバリエーション:
「この参照写真を編集してください。商品を、柔らかい朝の光が差し込む窓際の明るいオーク材のカウンターの上に配置します。商品のサイズ・色・ラベルは参照写真から変更しないでください。浅い被写界深度で、背景を柔らかくぼかしてください。自然でエディトリアルな商品写真のスタイル、追加のテキストなし。」
それぞれ2〜3パターンのバリエーションを生成してください。どちらも後で必要になります。スタジオ版が「公式」なショットになり、ライフスタイル版はもう一つのクリップとしてテストする材料になります。プロポーションと色が元の写真に最も近いバリエーションを選びましょう。ステップ3では、このフレームに既にあるズレがそのままアニメーション化されます。
Nano Banana 2と他の画像選択肢との比較については、GPT Image 2 vs Nano Banana 2:2026年はどちらのAI画像モデルを選ぶ?をご覧ください。プロンプトの書き方については、より良いプロンプトの書き方をご覧ください。
ステップ3:Seedance 2.0でショットにアニメーションを付ける
Nano Banana 2の出力をOmniArtの動画ワークスペースに持ち込み、Seedance 2.0を開きます。編集済みの写真をソースフレームとしてアップロードし、続けて——Seedance 2.0は最大9枚のタグ付き参照画像に対応しているため——同じ画像をプロンプト内で@image1として再度アップロードします。これにより、モデルには最初のフレームのアンカーと、動きを生成する際に保持すべきアイデンティティ参照の両方が与えられます。プロンプトではカメラと環境を描写し、商品そのものについては書かないようにしてください。商品は既に参照画像でロックされており、それについて何か書くと、モデルが「親切心」から変更してしまうリスクがあります。
ヒーロープッシュ:
「@image1が商品のリファレンスです。商品の形状・色・ラベルは、@image1に示された通りに一貫して保ってください。カメラは5秒かけて商品にゆっくりとプッシュインします。柔らかい光が表面をゆるやかに移動します。背景は静止、カメラの揺れなし、浅い被写界深度。」
ターンテーブル:
「@image1が商品のリファレンスです。商品はシームレスなスタジオ背景の上でその場に360度なめらかに回転し、カメラは固定されたままです。照明は回転を通じて一貫しています。小道具の追加なし、背景要素なし、テキストオーバーレイなし。」
まずは「Fast」モードで、安価に動きを確認するところから始めましょう。プロンプトとシードが気に入ったら、採用するテイクだけを「Standard」モードで再レンダリングします。Standardはクリップあたりのコストが高いため、実際に書き出すバージョンにだけ使うのが得策です。最初のパスではクリップを短く保ちましょう。いきなり15秒に挑むよりも、4〜5秒のほうが商品の忠実度を保ちやすくなります。
商品ショット以外のSeedance 2.0のプロンプトパターンについては、Seedance 2.0:AI動画のプロンプトパターンと6ユースケースをご覧ください。
ステップ4:写真から動画まで商品の一貫性を保つ
このワークフローで最もリスクが高い瞬間は、画像から動画への引き継ぎです。色、プロポーション、フレーミングが最もズレやすいのが、このタイミングです。
| ズレやすい要素 | 原因 | 固定する方法 |
|---|---|---|
| 色 | 動画モデルがフレームごとに照明を再解釈してしまう | プロンプトで正確な色名を指定する(例:「ラベルのネイビーブルーは変更しない」)、@image1を固定する |
| プロポーション | 回転やカメラの動きによって、Nano Banana 2が一度もレンダリングしたことのないアングルが露出する | 最初のパスではカメラの動きを小さく保つ。フル360度の前に、15〜20度の回転でテストする |
| フレーミング | 画像と動画のステップ間でアスペクト比が変わると、商品の切り取られ方が変わってしまう | 生成前に書き出し用のアスペクト比を設定しておく(後から変更しない) |
| ラベル・テキストの可読性 | モーションブラーと圧縮が、小さなテキストに最も影響しやすい | クレジットが許す最高解像度で生成し、テキストのある面をより長くカメラに向ける |
最初の結果をそのまま採用せず、2〜3パターンのシードバリエーションを生成して並べて比較しましょう。使えるクリップと歪んだクリップの差は、単にどのシードを採用したかだけということがよくあります。各バリエーションは、商品が最初のアングルから最も離れているフレームで判断してください。ズレはそこに最初に現れるからです。
ステップ5:仕上げ、サウンド追加、書き出し
無音の商品クリップは未完成に見えてしまいます。OmniArtは画像・動画・オーディオを一つのワークスペースにまとめているため、別のツールに切り替えることなく、書き出し前にサウンド仕上げを加えられます。カメラの動きに合わせた柔らかいウィッシュ音、軽いルームトーン、そしてオーディオモデルによる短い音楽キューなどです。長さは配置先に必要な分だけにトリミングしましょう。有料ソーシャルのヒーロークリップなら5〜8秒、追加の秒数が何か新しい情報を見せる場合に限り、それより長くします。チャンネルごとに書き出しましょう。フィード向けは正方形または4:5、Reels・TikTok・Shorts向けは9:16、商品ページやYouTube向けは16:9です。
ステップ2で編集したスタジオ写真は、参照ライブラリに保存しておきましょう。この商品に関する今後のすべての動画の出発点となるフレームになるため、次のSKUアップデートや季節限定バリエーションも、白紙の状態からではなく、固定された見た目を起点に始められます。
別の動画モデルを選ぶ場合
ここでSeedance 2.0を選んでいる理由は、その参照タグ付けシステムが、動きの中で商品のアイデンティティを保持する最も直接的な方法だからです。ただし、それが唯一の合理的な選択肢というわけではありません。用途別の代替案については、下のFAQをご覧ください。いずれのモデルも同じ動画ワークスペースにあるため、モデルを切り替えるのはドロップダウンを変更するだけで済み、ワークフローを作り直す必要はありません。
ラインナップ全体のツアーについては、すべてのAI動画モデルを1つのワークスペースで:OmniArtラインナップをご覧ください。気に入ったクリップができた後の広告フォーマットのアイデアについては、商品写真から動画広告へ:OmniArtで簡単に変換する方法をご覧ください。
FAQ
Nano Banana 2 LiteやGemini Omni FlashをOmniArtで今すぐ使えますか?
まだ使えません。Nano Banana 2 Liteと、Gemini Omni Flashの開発者向けAPIおよびそのチェイニング連携は2026年6月30日に発表されましたが(Omni Flash自体は、それより早く5月のGoogle I/Oでデビューしています)、本記事の執筆時点でどちらもOmniArtのワークスペースには統合されていません。このチュートリアルでは代わりにNano Banana 2(現行の、Liteではないモデル)とSeedance 2.0を使用しており、どちらも今すぐ利用できます。OmniArtは今後の追加に向けて、この新しいパイプラインを評価しています。導入された際には、Nano Banana 2 Liteのプロンプトガイドで詳細を取り上げます。
生の写真をそのままアニメーション化せず、先に編集するのはなぜですか?
編集ステップによって、動きが加わった後では直しにくくなる変数——背景、照明、ステージング——をコントロールできるからです。まずNano Banana 2で静止画の段階でそれらを整えておけば、動画モデルは動きを加えるだけで済み、商品を安定させながらごちゃついた背景を直すという作業をしなくて済みます。
元の写真の撮影に、プロ用の写真機材は必要ですか?
いいえ、必要ありません。無地で均一な照明の背景であれば、スマートフォンで撮影した写真でも問題なく機能します。求められているのは機材ではなく一貫性です。まともなスマートフォン写真をスタジオ撮影のような静止画に変えるのが、Nano Banana 2の編集ステップの役割です。
最終的な商品動画の長さはどれくらいが適切ですか?
有料ソーシャルやフィード向けの配置であれば、5〜8秒が実用的な範囲です。動きを見せるには十分な長さでありながら、注目を保つには十分に短い長さです。商品ページやYouTubeでは、追加の秒数が何か新しい情報を見せるのであれば、より長くしても構いません。
Seedance 2.0以外なら、どの動画モデルを使うべきですか?
案件次第です。ネイティブ4Kの放送品質の出力にはVeo 3.1、多数のSKUにわたるコスト効率の良い出力にはKling 3.0、高速でライフスタイル寄りのソーシャルクリップにはPixVerseが向いています。いずれもSeedance 2.0と同じOmniArtの動画ワークスペースで利用できます。
OmniArtで最終的な動画に音楽や効果音を追加できますか?
はい、追加できます。OmniArtのオーディオモデルは画像・動画ワークスペースと並んで用意されているため、プラットフォームを離れることなく、書き出したクリップに音楽キュー、効果音、ナレーションを追加できます。
OmniArtを始める
商品を1つ、クリーンな写真を1枚、そして15分だけ用意してください。画像ワークスペースでNano Banana 2を使って編集し、動画ワークスペースでSeedance 2.0を使ってその結果にアニメーションを付け、書き出し前に短い音楽キューを加えます。これが、GoogleがGemini向けにプレビューしたのと同じ写真から動画への流れであり、OmniArtに既にあるモデルの上で、今日から実行できます。
制作を始めますか?
AIで魅力的なコンテンツを生成しましょう