industry模型与洞察13 分钟阅读

Gemini Omni Flash 开发者 API 上线:I/O 之后有哪些新变化

Gemini Omni Flash 的开发者 API 已于 2026 年 6 月 30 日正式开放,这是继 5 月 19 日 Google I/O 首发六周后的新进展。本文解读新公布的按秒计价定价、开发者与企业可用渠道,以及全新 Nano Banana 2 Lite 串联搭配对 OmniArt 创作者来说意味着什么。

OmniArt 团队
Gemini Omni Flash 开发者 API 上线:I/O 之后有哪些新变化

Gemini Omni Flash 已于 5 月 19 日的 Google I/O 首发,当时以面向消费者的对话式视频模型身份亮相——当天就在 Gemini 应用、YouTube Shorts、YouTube Create 和 Google Flow 上线,而开发者 API 当时仅被描述为"未来几周内"推出。六周后,也就是 2026 年 6 月 30 日,这个承诺兑现了:Google 开放了开发者 API(gemini-omni-flash-preview),公布了按秒计价的定价,并为该模型搭配了一个全新的高速图片档位 Nano Banana 2 Lite——专为通过 Interactions API 与 Omni Flash 串联而打造。

本文将聚焦 I/O 之后的新变化:面向开发者的规格详情、Google 目前最力推的 Nano Banana 2 Lite 串联工作流,以及 Omni Flash 在 OmniArt 上的现状。关于最初的 I/O 发布内容以及 Google 保留了哪些功能,请参阅我们 6 月 12 日的报道;关于与 Veo 3.1 的完整规格对比,请参阅我们的专项对比文章

6 月 30 日的新变化:开发者 API

Gemini Omni Flash(API ID 为 gemini-omni-flash-preview)专为生成和对话式视频编辑而打造。以下是开发者 API 的已确认规格:

  • 价格: 每秒视频输出 $0.10——这是 API 自身的按秒计价标准,不同于覆盖 5 月 19 日消费端首发的消费级订阅定价(AI Plus、AI Ultra)。
  • 时长: 单次生成上限为 10 秒,自 I/O 以来未变;Google 表示更长时长即将推出。
  • 输入: 支持文本、图片和视频参考——但超过 3 秒的视频参考无法完整处理,目前不支持上传音频参考,API 中也还没有场景延展功能。
  • 新增可用渠道: Google AI Studio、Gemini API 和 Gemini 企业智能体平台——面向开发者和企业的访问渠道,与自 I/O 以来就已上线的消费级渠道(Gemini 应用、Google Flow)并存。
  • 内容溯源: 每个输出都带有 SynthID 水印,可在 Gemini 应用、Chrome 和搜索中验证——自发布以来未变。

Google 在开放 API 的同时,还推出了一个新的图片档位 Nano Banana 2 Lite(gemini-3.1-flash-lite-image)——每张图约 4 秒,1K 分辨率输出仅需 $0.034——专为通过 Interactions API 与 Omni Flash 串联使用而打造,利用 previous_interaction_id 在最多三次连续编辑之间保留会话历史。包括 Astrocade、HubX、Latitude、Stan、Magnific、Agent Opus、Cartwheel 和 Flora 在内的多家创意与开发者工具公司,都在发布前测试过这一搭配。

规划前需要了解的现有局限

警告

Omni Flash 的开发者 API 目前仍处于预览阶段。Google 在 I/O 时标注为"尚处早期"的几个部分,六周后的今天,依然是生产规划中最关键的那几项。

截至本次 API 发布,已确认的缺口如下:

  • 单次生成的硬性上限为 10 秒,自 I/O 以来未变。
  • 超过 3 秒的视频参考无法完整处理。
  • 尚不支持上传音频参考。
  • API 中尚不支持场景延展。
  • 跨场景切换时的角色一致性是官方承认的短板,尚未得到解决——Google 在 I/O 时就已指出这一点,如今依然如此。

对于一个预览级 API 来说,这些都算不上致命问题,但对任何在规划生产工作的人来说都很重要:目前的 Omni Flash 更像是一款快速、短片段、对话驱动的迭代工具,而不是能直接用于长篇叙事视频、播出级别的单一信源。

Nano Banana 2 Lite 到 Omni Flash 的串联是怎么运作的

串联模式正是 Google 这次发布中最力推的部分,官方通过三个命名工作流进行了演示:

  • "Anywhere"——用 Nano Banana 2 Lite 把一张照片换到新的场景,再用 Omni Flash 让画面动起来,整个过程都在同一个对话线程里完成。
  • "Space Lift"——把室内设计静态图变成电影感的漫游视频。
  • "Omni Product Studio"——把一张静态产品照片变成可直接用于电商的视频。

从技术上看,这一切都通过 Interactions API 实现:Nano Banana 2 Lite 每次生成都会返回一个 interaction ID,把这个 ID 作为 previous_interaction_id 传入下一次调用——无论是另一次图片编辑,还是一次 Omni Flash 视频生成——都能在最多三次连续编辑之间保留会话历史。这与单纯的"提示词直出视频"是完全不同的创作方式:先是提示词生成图片,再打磨这张图片,然后把打磨好的图片动画化,全程无需在每一步重新上传参考图或重新解释上下文。这正是这次发布真正新增的部分——5 月 19 日的 I/O 首发时,它还不存在。

Omni Flash 跨过 OmniArt 的两道门槛了吗?

OmniArt 自身的这套标准——在我们最初报道 I/O 前的那次泄露 时就已经确立——是只有跨过两道门槛,我们才会接入新模型:稳定的公开可用性,以及现有阵容尚未覆盖的真实创作需求。Omni Flash 早在 I/O 时就已经跨过了第一道门槛——自 5 月 19 日起,它就已公开可用、有明确定价、有完整文档记录。

第二道门槛则是一个需要坦诚面对的判断题——现在开发者 API 和 Nano Banana 2 Lite 的搭配已经出现,这个问题更值得如实回答。图生视频串联工作流——先用一款快速图片模型打磨静态图,再在同一会话内直接动画化,无需重新上传参考图——确实是一个有力的候选场景。Veo 3.1、Sora 2、V6、Kling 3.0、HappyHorse 1.0、Seedance 2.0、Runway Gen-4.5、Hailuo 和 Grok Imagine 都不具备 Omni Flash 与 Nano Banana 2 Lite 这种通过会话保留型 API 原生耦合姊妹图片模型的能力。

但另一面是:10 秒的硬性时长上限、未公开的分辨率数据、跨场景切换时较弱的角色一致性,以及尚不支持场景延展或音频参考的编辑 API。这些都是预览阶段的局限,还谈不上打磨到位的成品体验。

直说结论:Gemini Omni Flash 目前还没有接入 OmniArt。今天打开视频工作区,你能看到的是 Veo 3.1、Sora 2、V6、Kling 3.0、HappyHorse 1.0、Seedance 2.0、Runway Gen-4.5、Hailuo 和 Grok Imagine——唯独没有 Omni Flash。目前 OmniArt 图片工作区中已经可用的,是同系列的图片模型 Nano Banana 2gemini-3.1-flash)——因此 Google "Anywhere" 和 "Omni Product Studio" 演示中图片的那一半,你现在就能在 OmniArt 上大致还原:先用 Nano Banana 2 生成并打磨一张静态图,再交给现有视频阵容中的任意模型进行动画化。这与 Google 演示的那种专属于 Omni Flash 和 Nano Banana 2 Lite 的单线程 Interactions API 串联并不完全相同。

随着 Omni Flash 的 API 逐步走出预览阶段,我们会持续关注它在"真实创作需求"这一项上的表现。想了解目前的完整阵容以及每个模型各自的定位,请参阅视频工作区全览

FAQ

Gemini Omni Flash 到底是什么时候发布的?

从某种意义上说,它发布了两次。2026 年 5 月 19 日的 Google I/O 是面向消费者的首次发布——当天就已经在 Gemini 应用、YouTube Shorts、YouTube Create 和 Google Flow 上线。开发者 API(gemini-omni-flash-preview)则在六周后的 2026 年 6 月 30 日跟进推出,同时公布了按秒计价的定价,以及本文介绍的 Nano Banana 2 Lite 串联搭配。

Gemini Omni Flash 的 API 收费多少?

通过开发者 API 使用时,每秒视频输出为 $0.10,目前单次生成上限为 10 秒。这与覆盖 Gemini 应用和 Google Flow 访问权限的消费级订阅定价(AI Plus、AI Ultra)是分开计算的。

Gemini Omni Flash 和 Veo 是同一个模型吗?

不是。Omni Flash 是一个独立、专门打造的视频与对话式编辑模型,拥有自己的 API ID 和定价,与 Veo 3.1 并行存在而非取而代之。完整的逐项规格对比,请参阅我们的 Omni Flash 对比 Veo 3.1 评测

我现在能在 OmniArt 上使用 Gemini Omni Flash 吗?

还不能。它的开发者 API 已于 2026 年 6 月 30 日开放,但目前还不在 OmniArt 的视频阵容中。OmniArt 会在模型跨过稳定公开可用性、以及填补现有阵容未覆盖的真实创作需求这两道门槛后才会接入——Omni Flash 早在 I/O 时就已跨过第一道门槛,第二道门槛仍在评估中。与之相关的图片模型 Nano Banana 2,目前已经可以在 OmniArt 图片工作区中使用。

什么是 Nano Banana 2 Lite?它和 Omni Flash 是什么关系?

Nano Banana 2 Lite(gemini-3.1-flash-lite-image)是与 Omni Flash 开发者 API 同期发布的全新高速低价图片档位——每张图约 4 秒,1K 分辨率输出仅需 $0.034。它专为通过 Interactions API 直接串联到 Omni Flash 而设计,能在最多三次连续编辑之间保留会话历史。想了解它与 Nano Banana 2 系列其他档位的对比,请参阅 Nano Banana 2 Lite 对比 2 与 Pro

在 OmniArt 上开始创作

Gemini Omni Flash 目前还没有进入 OmniArt 工作区,但它所依托的那套工作流——先打磨图片,再动画化——今天就已经能用。在 OmniArt 图片工作区用 Nano Banana 2 生成或打磨一张静态图,再交给 Veo 3.1、V6、Kling 3.0 或视频阵容中的任意模型进行动画化。完整操作步骤请参阅产品图转视频工作流指南。一旦它的 API 跨过 OmniArt 工作区的接入门槛,我们会第一时间为它撰写专门报道。

准备好创作了吗?

开始用 AI 生成精彩内容

免费开始