industryMô hình và insight11 phút đọc

API Gemini Omni Flash dành cho nhà phát triển: điểm mới sau I/O

API dành cho nhà phát triển của Gemini Omni Flash mở ngày 30 tháng 6 năm 2026, sáu tuần sau I/O — kèm giá theo giây và cặp đôi nối chuỗi Nano Banana 2 Lite mới.

Đội ngũ OmniArt
API Gemini Omni Flash dành cho nhà phát triển: điểm mới sau I/O

Gemini Omni Flash đã ra mắt tại Google I/O ngày 19 tháng 5 với vai trò một model video hội thoại dành cho người dùng phổ thông — hoạt động ngay trong ngày trên ứng dụng Gemini, YouTube Shorts, YouTube Create và Google Flow, còn API dành cho nhà phát triển khi đó chỉ được mô tả là "sẽ có trong vài tuần tới". Sáu tuần sau, ngày 30 tháng 6 năm 2026, lời hứa đó đã thành hiện thực: Google mở API dành cho nhà phát triển (gemini-omni-flash-preview), công bố mức giá theo giây, và ghép model này với một hạng ảnh tốc độ cao mới, Nano Banana 2 Lite, được xây dựng riêng để nối chuỗi vào Omni Flash qua Interactions API.

Bài viết này nói về những điểm mới kể từ sau I/O: các thông số dành cho nhà phát triển, quy trình nối chuỗi Nano Banana 2 Lite mà Google đang đẩy mạnh nhất, và vị trí hiện tại của Omni Flash trên OmniArt. Để xem lại bản ra mắt gốc tại I/O và những gì Google từng giữ lại chưa công bố, xem bài viết của chúng tôi từ ngày 12 tháng 6; để xem bảng so sánh thông số đầy đủ với Veo 3.1, xem bài so sánh riêng của chúng tôi.

Điều mới ngày 30 tháng 6: API dành cho nhà phát triển

Gemini Omni Flash (id API gemini-omni-flash-preview) được xây dựng cho việc tạo video và chỉnh sửa video qua hội thoại. Các thông số đã xác nhận cho API dành cho nhà phát triển:

  • Giá: $0,10 cho mỗi giây video đầu ra — đây là mức giá riêng theo giây của API, khác với giá gói thuê bao dành cho người dùng phổ thông (AI Plus, AI Ultra) áp dụng cho bản ra mắt ngày 19 tháng 5.
  • Thời lượng: giới hạn tối đa 10 giây cho mỗi lượt tạo, không đổi kể từ I/O; Google cho biết thời lượng dài hơn sẽ sớm có mặt.
  • Đầu vào: văn bản, ảnh và video tham chiếu — tuy nhiên các video tham chiếu dài hơn 3 giây chưa được xử lý đầy đủ, chưa hỗ trợ tải lên audio tham chiếu, và API chưa hỗ trợ mở rộng cảnh.
  • Kênh khả dụng mới: Google AI Studio, Gemini API và Gemini Enterprise Agent Platform — quyền truy cập dành cho nhà phát triển và doanh nghiệp, bên cạnh các kênh dành cho người dùng phổ thông (ứng dụng Gemini, Google Flow) đã hoạt động từ sau I/O.
  • Nguồn gốc: mọi kết quả đầu ra đều có hình mờ SynthID, có thể xác minh trong ứng dụng Gemini, Chrome và Search — không đổi kể từ khi ra mắt.

Google mở API này kèm theo một hạng ảnh mới, Nano Banana 2 Lite (gemini-3.1-flash-lite-image) — khoảng 4 giây mỗi ảnh, $0,034 cho một kết quả độ phân giải 1K — được thiết kế riêng để nối chuỗi vào Omni Flash qua Interactions API, dùng previous_interaction_id để giữ lịch sử phiên làm việc qua tối đa ba lượt chỉnh sửa liên tiếp. Nhiều công ty sáng tạo và công cụ phát triển, bao gồm Astrocade, HubX, Latitude, Stan, Magnific, Agent Opus, Cartwheel và Flora, đã thử nghiệm cặp đôi này trước khi ra mắt.

Những giới hạn hiện tại cần biết trước khi lên kế hoạch

Cảnh báo

API dành cho nhà phát triển của Omni Flash vẫn đang ở giai đoạn xem trước. Một số điểm Google từng đánh dấu là "còn sớm" tại I/O, sáu tuần sau vẫn chính là những điểm quan trọng nhất khi lên kế hoạch sản xuất.

Những khoảng trống đã xác nhận tính đến đợt mở API này:

  • 10 giây là giới hạn cứng cho mỗi lượt tạo, không đổi kể từ I/O.
  • Video tham chiếu dài hơn 3 giây chưa được xử lý đầy đủ.
  • Chưa hỗ trợ tải lên audio tham chiếu.
  • API chưa hỗ trợ mở rộng cảnh.
  • Độ nhất quán của nhân vật khi chuyển cảnh là điểm yếu đã được thừa nhận, chưa phải vấn đề đã giải quyết — Google từng nêu điều này tại I/O, và đến nay vẫn đúng.

Không điểm nào trong số này là rào cản với một API ở giai đoạn xem trước, nhưng chúng đều quan trọng với bất kỳ ai đang lên kế hoạch sản xuất: ở thời điểm hiện tại, Omni Flash giống một công cụ lặp nhanh, dạng ngắn, điều khiển qua chat, hơn là một nguồn duy nhất sẵn sàng phát sóng cho video tự sự dài hơi.

Cách chuỗi Nano Banana 2 Lite → Omni Flash hoạt động

Mô hình nối chuỗi này là phần Google đang đẩy mạnh nhất trong đợt cập nhật này, và được trình diễn qua ba quy trình có tên riêng:

  • "Anywhere" — một ảnh được chuyển sang bối cảnh mới bằng Nano Banana 2 Lite, sau đó được thổi thành chuyển động bằng Omni Flash, tất cả trong cùng một luồng hội thoại.
  • "Space Lift" — ảnh tĩnh thiết kế nội thất trở thành video dẫn dắt tham quan mang tính điện ảnh.
  • "Omni Product Studio" — một ảnh sản phẩm tĩnh trở thành video sẵn sàng cho thương mại điện tử.

Về mặt kỹ thuật, quy trình này chạy qua Interactions API: một lượt tạo từ Nano Banana 2 Lite trả về một id tương tác, và khi truyền id đó dưới dạng previous_interaction_id vào lệnh gọi tiếp theo — dù là một lượt chỉnh sửa ảnh khác hay một lượt tạo video bằng Omni Flash — hệ thống sẽ giữ lại lịch sử phiên làm việc qua tối đa ba lượt chỉnh sửa liên tiếp. Đây là một công việc sáng tạo khác hẳn về bản chất so với tạo video trực tiếp từ prompt: nó là prompt tạo ảnh, tinh chỉnh ảnh, rồi thổi chuyển động cho ảnh đã tinh chỉnh, mà không cần tải lại ảnh tham chiếu hay giải thích lại bối cảnh ở từng bước. Đây chính là phần thực sự mới của đợt cập nhật này — nó chưa từng tồn tại ở bản ra mắt I/O ngày 19 tháng 5.

Omni Flash có vượt qua hai tiêu chí của OmniArt không?

Tiêu chuẩn của OmniArt, được nêu lần đầu khi chúng tôi đưa tin về tin rò rỉ trước thềm I/O, là chỉ bổ sung model khi model đó vượt qua hai tiêu chí: sẵn sàng công khai ổn định, và giải quyết một nhu cầu sáng tạo thực tế mà dàn model hiện tại chưa đáp ứng. Omni Flash đã vượt qua tiêu chí đầu tiên ngay từ I/O — model đã công khai, có giá và có tài liệu đầy đủ kể từ ngày 19 tháng 5.

Tiêu chí thứ hai đòi hỏi một đánh giá thực sự, và đáng để nói thẳng thắn giờ khi API dành cho nhà phát triển và cặp đôi Nano Banana 2 Lite đã tồn tại. Quy trình nối ảnh sang video — tinh chỉnh một ảnh tĩnh bằng model ảnh tốc độ cao, rồi thổi chuyển động cho nó trong cùng một phiên làm việc mà không cần tải lại ảnh tham chiếu — là một ứng viên xứng đáng. Không model nào trong số Veo 3.1, Sora 2, V6, Kling 3.0, HappyHorse 1.0, Seedance 2.0, Runway Gen-4.5, Hailuo hay Grok Imagine kết nối gốc với một model ảnh cùng dòng qua API giữ phiên làm việc theo cách Omni Flash và Nano Banana 2 Lite đang làm.

Đối trọng lại là: giới hạn cứng 10 giây, chưa công bố thông số độ phân giải, độ nhất quán nhân vật còn yếu khi chuyển cảnh, và một API chỉnh sửa chưa hỗ trợ mở rộng cảnh hay video/audio tham chiếu đầy đủ. Đây là những giới hạn của giai đoạn xem trước, chưa phải độ hoàn thiện của một sản phẩm đã hoàn tất.

Nói thẳng về hiện trạng: Gemini Omni Flash chưa có mặt trên OmniArt. Mở không gian tạo video hôm nay, bạn sẽ thấy Veo 3.1, Sora 2, V6, Kling 3.0, HappyHorse 1.0, Seedance 2.0, Runway Gen-4.5, Hailuo và Grok Imagine — không có Omni Flash. Thứ đã có sẵn trên OmniArt hôm nay là Nano Banana 2 (gemini-3.1-flash), model ảnh cùng dòng, nằm trong không gian tạo ảnh — vì vậy phần "ảnh" trong hai bản demo "Anywhere" và "Omni Product Studio" của Google là quy trình bạn đã có thể mô phỏng gần đúng trên OmniArt ngay bây giờ: tạo và tinh chỉnh một ảnh tĩnh bằng Nano Banana 2, rồi chuyển sang bất kỳ model nào trong dàn video hiện có để thổi chuyển động. Đây không phải chuỗi Interactions API một luồng duy nhất mà Google trình diễn, vốn chỉ dành riêng cho Omni Flash và Nano Banana 2 Lite.

Chúng tôi sẽ tiếp tục theo dõi luận điểm về "nhu cầu sáng tạo thực tế" khi API của Omni Flash vượt qua giai đoạn xem trước. Để xem dàn model hiện tại và lý do mỗi model có chỗ đứng riêng, xem Mọi model video AI trong một workspace: lineup OmniArt.

Câu hỏi thường gặp

Gemini Omni Flash thực sự ra mắt khi nào?

Có thể nói model này đã ra mắt hai lần. Google I/O ngày 19 tháng 5 năm 2026 là bản ra mắt dành cho người dùng phổ thông — hoạt động ngay trong ngày trên ứng dụng Gemini, YouTube Shorts, YouTube Create và Google Flow. API dành cho nhà phát triển (gemini-omni-flash-preview) theo sau sáu tuần sau đó, vào ngày 30 tháng 6 năm 2026, cùng với mức giá theo giây và cặp đôi nối chuỗi Nano Banana 2 Lite được nói đến trong bài viết này.

API của Gemini Omni Flash có giá bao nhiêu?

$0,10 cho mỗi giây video đầu ra qua API dành cho nhà phát triển, với mỗi lượt tạo hiện giới hạn tối đa 10 giây. Mức giá này tách biệt với giá gói thuê bao dành cho người dùng phổ thông (AI Plus, AI Ultra) áp dụng cho quyền truy cập qua ứng dụng Gemini và Google Flow.

Gemini Omni Flash có phải cùng một model với Veo không?

Không. Omni Flash là một model video và chỉnh sửa qua hội thoại riêng biệt, có id API và mức giá riêng, hoạt động song song với Veo 3.1 thay vì thay thế nó. Để xem bảng so sánh chi tiết từng thông số, xem bài so sánh Omni Flash với Veo 3.1 của chúng tôi.

Tôi có thể dùng Gemini Omni Flash trên OmniArt ngay hôm nay không?

Chưa. API dành cho nhà phát triển của model này mở ngày 30 tháng 6 năm 2026, và hiện chưa nằm trong dàn model video của OmniArt. OmniArt chỉ bổ sung model khi model đó sẵn sàng công khai ổn định và giải quyết một nhu cầu sáng tạo thực tế mà dàn model hiện tại chưa đáp ứng — Omni Flash đã vượt qua tiêu chí đầu tiên ngay từ I/O và đang được đánh giá theo tiêu chí thứ hai. Nano Banana 2, model ảnh cùng dòng, đã có sẵn trên không gian tạo ảnh của OmniArt.

Nano Banana 2 Lite là gì và liên quan thế nào đến Omni Flash?

Nano Banana 2 Lite (gemini-3.1-flash-lite-image) là hạng ảnh mới, nhanh và chi phí thấp, ra mắt cùng thời điểm với API dành cho nhà phát triển của Omni Flash — khoảng 4 giây mỗi ảnh với giá $0,034 cho một kết quả độ phân giải 1K. Model được xây dựng để nối trực tiếp vào Omni Flash qua Interactions API, giữ lại lịch sử phiên làm việc qua tối đa ba lượt chỉnh sửa liên tiếp. Để xem model này so với phần còn lại của dòng Nano Banana 2, xem Nano Banana 2 Lite, 2 hay Pro: nên chọn model Gemini nào?.

Bắt đầu trên OmniArt

Gemini Omni Flash chưa có trên không gian làm việc của OmniArt, nhưng quy trình mà model này được xây dựng xoay quanh — tinh chỉnh một ảnh, rồi thổi chuyển động cho nó — đã hoạt động được ngay hôm nay. Hãy tạo hoặc tinh chỉnh một ảnh tĩnh bằng Nano Banana 2 trong không gian tạo ảnh của OmniArt, rồi chuyển sang Veo 3.1, V6, Kling 3.0, hoặc bất kỳ model nào trong dàn video để thổi chuyển động. Để xem hướng dẫn đầy đủ cho quy trình này, xem hướng dẫn quy trình từ ảnh sản phẩm đến video. Chúng tôi sẽ viết trực tiếp về Omni Flash ngay khi API của model này vượt qua tiêu chí của OmniArt để vào không gian làm việc.

Sẵn sàng sáng tạo?

Bắt đầu tạo nội dung tuyệt vời bằng AI

Bắt đầu miễn phí