tutorialHướng dẫn và cách làm15 phút đọc

Từ ảnh sản phẩm đến video: quy trình AI trên OmniArt

Biến một ảnh sản phẩm thành video cuốn hút ngay từ giây đầu bằng các model đã có trên OmniArt hôm nay — cùng quy trình ảnh sang video Google vừa hé lộ cho Gemini.

Đội ngũ OmniArt
Từ ảnh sản phẩm đến video: quy trình AI trên OmniArt

Ngày 30 tháng 6, Google trình diễn một cặp đôi mới bên trong Gemini: Nano Banana 2 Lite để chỉnh sửa ảnh nhanh và Gemini Omni Flash để tạo video ngắn, nối với nhau qua Interactions API. Bản demo chủ lực, Omni Product Studio, lấy một ảnh sản phẩm tĩnh, chỉnh sửa thành một cảnh sản phẩm sạch sẽ cho thương mại điện tử, rồi thổi cảnh đó thành một video ngắn — tất cả trong một quy trình liền mạch. Google trình diễn cùng một mô hình đó thêm hai lần nữa, với "Anywhere" (đặt một ảnh vào bối cảnh mới, rồi thổi chuyển động) và "Space Lift" (ảnh tĩnh thiết kế nội thất trở thành video dẫn dắt tham quan mang tính điện ảnh). Điểm chung của cả ba: chỉnh sửa ảnh trước, rồi mới chuyển sang một model video.

Bạn không cần đúng quy trình của Google để thực hiện việc này. OmniArt đã sẵn có hai mảnh ghép quan trọng nhất — một model ảnh được xây dựng cho kiểu chỉnh sửa này, và một dàn model video biến ảnh tĩnh thành chuyển động. Bên dưới là toàn bộ quy trình từ ảnh đến video theo đúng hình mẫu đó — chuẩn bị, chỉnh sửa, thổi chuyển động, xuất file — dùng các model đã xác nhận hoạt động trên OmniArt hôm nay, kèm prompt mẫu cho từng bước.

Những gì thực sự đã có trên OmniArt hôm nay

Nano Banana 2 Lite hoàn toàn mới, còn API dành cho nhà phát triển của Gemini Omni Flash cùng cặp đôi nối chuỗi với model này vừa mới mở — cả hai đều chưa có trên không gian làm việc của OmniArt, và hướng dẫn này sẽ không yêu cầu bạn dùng chúng. Thứ đang hoạt động ngay lúc này là Nano Banana 2 (không phải hạng Lite mới) cho bước chỉnh sửa ảnh, gắn nhãn mới và nổi bật trong bảng chọn model ảnh, cùng một dàn model video đầy đủ — bao gồm Seedance 2.0, model được ghép cặp ở đây — cho bước thổi chuyển động. Mọi prompt bên dưới đều chạy trên các model bạn có thể mở ngay hôm nay.

Mẹo

Cặp đôi Omni Product Studio của Google — Nano Banana 2 Lite ($0,034 cho mỗi ảnh độ phân giải 1K, ~4 giây mỗi ảnh) cho bước chỉnh sửa, Gemini Omni Flash ($0,10 mỗi giây, giới hạn 10 giây) cho bước thổi chuyển động, nối với nhau qua Interactions API — là một phiên bản chuyên biệt của chính quy trình bên dưới. Cả hai model đều chưa có trên không gian làm việc của OmniArt; OmniArt đang đánh giá cả hai. Khi chúng có mặt, các bước này sẽ không đổi — chỉ nhanh hơn và rẻ hơn. Để biết thêm bối cảnh, xem API Gemini Omni Flash dành cho nhà phát triển: điểm mới sau I/ONano Banana 2 Lite, 2 hay Pro: nên chọn model Gemini nào?.

Những gì bạn cần

  • Một ảnh sản phẩm — của riêng bạn hoặc một ảnh catalog sạch sẽ
  • Một tài khoản OmniArt có quyền truy cập không gian tạo ảnh và video
  • Nano Banana 2 cho bước chỉnh sửa
  • Một model video cho bước thổi chuyển động — hướng dẫn này dùng Seedance 2.0 vì hệ thống tham chiếu của model này giữ hình dạng và màu sắc sản phẩm rất tốt trong suốt chuyển động
  • Tùy chọn: các model audio của OmniArt để thêm âm thanh trước khi xuất file
BướcKhông gian làm việcModelViệc cần làm
1Chụp hoặc tìm một ảnh sản phẩm sạch sẽ
2ẢnhNano Banana 2Làm sạch nền, dàn dựng, tạo biến thể phong cách sinh hoạt
3VideoSeedance 2.0Thổi chuyển động cho ảnh đã chỉnh sửa thành một clip ngắn
4VideoSeedance 2.0Giữ nhất quán giữa các biến thể seed
5Audio + xuất fileThêm âm thanh và xuất theo từng nền tảng

Bước 1: chụp hoặc tìm một ảnh sản phẩm sạch sẽ

Bước chỉnh sửa và thổi chuyển động chỉ có thể làm việc với những gì đã có sẵn trong khung hình đầu tiên, nên vài phút chuẩn bị ở đây sẽ đem lại lợi ích gấp đôi.

  • Nền đơn giản, ánh sáng đều. Trắng, xám, hoặc giấy nền liền mạch — Nano Banana 2 chỉnh sửa sạch hơn nhiều trên một nền đơn giản so với một nền rối mắt.
  • Ánh sáng khuếch tán. Bóng đổ gắt và phản chiếu cháy sáng là những thứ model video dễ làm biến dạng nhất một khi sản phẩm bắt đầu chuyển động.
  • Lấp đầy khung hình. Giữ sản phẩm là chủ thể chiếm ưu thế; model video sẽ bám theo bất cứ thứ gì chiếm trọng tâm thị giác lớn nhất trong khung hình đầu tiên.
  • Chụp ở góc thẳng nhất, đại diện nhất. Đây sẽ là khung hình đầu tiên, và mọi khung hình sau đó đều được so sánh với nó.
  • Dùng độ phân giải cao nhất bạn có. Nhãn mác và chi tiết nhỏ sẽ giữ được rõ nét hơn qua cả hai bước khi có nhiều pixel gốc hơn để xử lý.

Bắt đầu từ một ảnh catalog có sẵn thay vì chụp mới? Quy tắc vẫn như vậy — làm dịu bóng đổ gắt và cắt bỏ chi tiết thừa trước Bước 2, vì Nano Banana 2 chỉnh sửa những gì đã có sẵn chứ không tạo ra một sản phẩm mới.

Bước 2: chỉnh sửa và dàn dựng ảnh bằng Nano Banana 2

Mở Nano Banana 2 trong không gian tạo ảnh của OmniArt và tải ảnh gốc lên làm ảnh tham chiếu — bạn đang chỉnh sửa nó, không phải mô tả một cảnh hoàn toàn mới từ đầu. Đây là phần đáng học hỏi trực tiếp từ demo của Google: bước ảnh là một lượt chỉnh sửa có mục tiêu rõ ràng. Nano Banana 2 được tinh chỉnh cho các chỉnh sửa nhanh, cân bằng, thay vì render chậm và tối đa hóa chi tiết — điều này phù hợp để tạo vài biến thể dàn dựng cho mỗi sản phẩm thay vì một ảnh chủ đạo duy nhất.

Hai prompt đáng thử:

Nền studio sạch sẽ:

"Edit this reference photo. Replace the background with a seamless soft lilac-gray studio backdrop. Keep the product's shape, proportions, color, and label text exactly as shown in the reference. Add soft, diffused studio lighting from the upper left and a subtle reflection on the surface below. Do not change the product itself."

Biến thể phong cách sinh hoạt:

"Edit this reference photo. Place the product on a light oak counter near a window with soft morning light. Keep the product's size, color, and label unchanged from the reference. Add a shallow depth of field with a softly blurred background. Natural, editorial product-photography style, no added text."

Hãy tạo hai hoặc ba biến thể cho mỗi kiểu — bạn sẽ cần cả hai sau này, vì bản dựng studio sẽ trở thành ảnh "chính thức", còn bản phong cách sinh hoạt cho bạn thêm một clip để thử nghiệm. Chọn biến thể nào giữ tỷ lệ và màu sắc gần với ảnh gốc nhất; Bước 3 sẽ thổi chuyển động cho bất kỳ sai lệch nào đã có sẵn trong khung hình này.

Để biết thêm về Nano Banana 2 so với các lựa chọn ảnh khác, xem GPT Image 2 hay Nano Banana 2: chọn model ảnh AI năm 2026. Để biết kỹ thuật viết prompt, xem Cách viết prompt tốt hơn cho tạo nội dung AI.

Bước 3: thổi chuyển động cho ảnh bằng Seedance 2.0

Đưa kết quả từ Nano Banana 2 vào không gian tạo video của OmniArt và mở Seedance 2.0. Tải ảnh đã chỉnh sửa lên làm khung hình gốc, sau đó — vì Seedance 2.0 nhận tới chín ảnh tham chiếu có gắn thẻ — tải ảnh đó lên lần nữa dưới dạng @image1 trong prompt. Điều này cho model một điểm neo khung hình đầu tiên, cộng thêm một tham chiếu nhận diện để giữ nguyên trong lúc tạo chuyển động. Hãy mô tả camera và bối cảnh, đừng mô tả sản phẩm — sản phẩm đã được khóa từ ảnh tham chiếu, và bất cứ điều gì bạn viết thêm về nó đều có nguy cơ khiến model "nhiệt tình" thay đổi nó.

Đẩy máy vào chủ thể:

"@image1 is the product reference. Keep the product's shape, color, and label exactly as shown in @image1 throughout. Camera slowly pushes in on the product over 5 seconds. Soft light shifts gently across the surface. Static background, no camera shake, shallow depth of field."

Xoay vòng sản phẩm:

"@image1 is the product reference. The product rotates smoothly 360 degrees in place on a seamless studio backdrop, camera locked in position. Lighting stays consistent through the rotation. No added props, no background elements, no text overlays."

Hãy bắt đầu ở chế độ Fast để xem thử chuyển động với chi phí thấp, rồi render lại bản ưng ý ở chế độ Standard khi bạn đã hài lòng với prompt và seed — Standard tốn nhiều chi phí hơn cho mỗi clip, nên chỉ dùng cho phiên bản bạn thực sự sẽ xuất file. Giữ clip ngắn ở lượt thử đầu tiên; 4–5 giây giữ độ trung thực của sản phẩm tốt hơn nhiều so với nhảy thẳng lên 15 giây.

Để xem thêm các mẫu prompt Seedance 2.0 ngoài ảnh sản phẩm, xem Seedance 2.0: pattern prompt và sáu use case video AI.

Bước 4: giữ sản phẩm nhất quán từ ảnh sang video

Thời điểm rủi ro nhất trong quy trình này là lúc chuyển giao giữa ảnh và video — đây là nơi màu sắc, tỷ lệ và khung hình dễ bị sai lệch nhất.

Yếu tố dễ sai lệchVì sao xảy raCách giữ ổn định
Màu sắcModel video diễn giải lại ánh sáng ở mỗi khung hìnhNêu rõ màu chính xác trong prompt ("giữ nguyên màu xanh navy của nhãn") và ghim @image1
Tỷ lệXoay và di chuyển camera lộ ra những góc mà Nano Banana 2 chưa từng renderGiữ chuyển động camera nhỏ ở lượt đầu; thử góc xoay 15–20° trước khi xoay đủ 360 độ
Khung hìnhThay đổi tỷ lệ khung hình giữa bước ảnh và video làm crop sản phẩm khác điĐặt tỷ lệ khung hình xuất file trước khi tạo, không phải sau
Độ rõ của nhãn / chữNhòe chuyển động và nén ảnh ảnh hưởng nặng nhất tới chữ nhỏTạo ở độ phân giải cao nhất mà số credits cho phép, và giữ bề mặt có chữ hướng về camera lâu hơn

Hãy tạo hai hoặc ba biến thể seed và so sánh cạnh nhau thay vì chấp nhận ngay kết quả đầu tiên — ranh giới giữa một clip dùng được và một clip bị biến dạng thường chỉ nằm ở việc bạn giữ lại seed nào. Đánh giá từng biến thể ở khung hình mà sản phẩm lệch xa nhất so với góc ban đầu, vì đó là nơi sai lệch xuất hiện đầu tiên.

Bước 5: hoàn thiện, thêm âm thanh và xuất file

Một clip sản phẩm không có âm thanh sẽ trông như chưa hoàn thiện. Vì OmniArt gộp chung ảnh, video và audio trong một không gian làm việc, hãy thêm âm thanh trước khi xuất file thay vì chuyển qua một công cụ riêng — một tiếng vút nhẹ theo chuyển động camera, tiếng nền không gian nhẹ, và một đoạn nhạc ngắn từ các model audio. Cắt clip theo đúng nhu cầu của vị trí đăng: 5–8 giây cho một clip quảng cáo mạng xã hội trả phí, dài hơn chỉ khi những giây thêm vào thể hiện điều gì đó mới. Xuất file theo từng kênh — vuông hoặc 4:5 cho feed, 9:16 cho Reels, TikTok và Shorts, 16:9 cho trang sản phẩm hoặc YouTube.

Hãy lưu ảnh studio đã chỉnh sửa từ Bước 2 vào thư viện tham chiếu của bạn — ảnh này sẽ trở thành khung hình khởi đầu cho mọi video sau này của sản phẩm, để lần cập nhật SKU hay biến thể theo mùa tiếp theo bắt đầu từ một diện mạo đã chốt sẵn, thay vì từ con số không.

Chọn một model video khác

Seedance 2.0 được chọn ở đây vì hệ thống gắn thẻ tham chiếu của model này là cách trực tiếp nhất để giữ đúng nhận diện sản phẩm trong suốt chuyển động, nhưng đây không phải lựa chọn duy nhất hợp lý — xem phần Câu hỏi thường gặp bên dưới để biết các lựa chọn thay thế theo từng nhu cầu. Tất cả đều nằm trong cùng một không gian tạo video, nên đổi model chỉ là đổi một lựa chọn trong danh sách thả xuống, không phải xây lại cả quy trình.

Để xem toàn cảnh dàn model, xem Mọi model video AI trong một workspace: lineup OmniArt. Để có thêm ý tưởng định dạng quảng cáo khi đã có một clip ưng ý, xem Biến ảnh sản phẩm thành video quảng cáo với OmniArt.

Câu hỏi thường gặp

Tôi có thể dùng Nano Banana 2 Lite hoặc Gemini Omni Flash trên OmniArt ngay hôm nay không?

Chưa. Nano Banana 2 Lite cùng API dành cho nhà phát triển và cặp đôi nối chuỗi của Gemini Omni Flash được công bố ngày 30 tháng 6 năm 2026 (bản thân Omni Flash đã ra mắt sớm hơn, tại Google I/O vào tháng 5), và tính đến thời điểm viết bài, cả hai đều chưa được tích hợp vào không gian làm việc của OmniArt. Hướng dẫn này dùng Nano Banana 2 (model hiện tại, không phải bản Lite) và Seedance 2.0 thay thế — cả hai đều đang hoạt động. OmniArt đang đánh giá quy trình mới này để bổ sung trong tương lai; khi có mặt, xem hướng dẫn viết prompt cho Nano Banana 2 Lite của chúng tôi để biết chi tiết.

Vì sao nên chỉnh sửa ảnh trước khi thổi chuyển động, thay vì thổi chuyển động trực tiếp từ ảnh gốc?

Vì bước chỉnh sửa kiểm soát những yếu tố khó sửa nhất một khi đã có chuyển động — nền, ánh sáng, dàn dựng. Sửa những yếu tố này trên ảnh tĩnh bằng Nano Banana 2 trước có nghĩa là model video chỉ cần thêm chuyển động, chứ không phải vừa sửa một nền rối mắt vừa giữ sản phẩm ổn định.

Tôi có cần thiết bị chụp ảnh chuyên nghiệp cho ảnh gốc không?

Không. Một ảnh chụp bằng điện thoại trên nền đơn giản, ánh sáng đều là đủ dùng — yêu cầu ở đây là sự nhất quán, không phải thiết bị. Bước chỉnh sửa của Nano Banana 2 mới là thứ biến một ảnh điện thoại khá ổn thành một ảnh tĩnh trông như chụp tại studio.

Video sản phẩm cuối cùng nên dài bao lâu?

Với vị trí đăng quảng cáo mạng xã hội trả phí và feed, 5–8 giây là khoảng thời lượng phù hợp — đủ dài để thể hiện chuyển động, đủ ngắn để giữ sự chú ý. Trang sản phẩm và YouTube có thể dài hơn nếu những giây thêm vào thể hiện điều gì đó mới.

Nên dùng model video nào nếu không phải Seedance 2.0?

Tùy vào nhu cầu: Veo 3.1 cho kết quả 4K gốc, phong cách phát sóng; Kling 3.0 cho kết quả tiết kiệm chi phí trên nhiều SKU; PixVerse cho các clip mạng xã hội nhanh, thiên hướng phong cách sinh hoạt. Tất cả đều có trong cùng không gian tạo video của OmniArt như Seedance 2.0.

Tôi có thể thêm nhạc hoặc hiệu ứng âm thanh vào video cuối cùng trên OmniArt không?

Có. Các model audio của OmniArt nằm ngay cạnh không gian tạo ảnh và video, nên bạn có thể thêm nhạc nền, hiệu ứng âm thanh, hoặc lời đọc vào clip đã xuất mà không cần rời khỏi nền tảng.

Bắt đầu trên OmniArt

Hãy chọn một sản phẩm, một ảnh sạch sẽ, và mười lăm phút. Chỉnh sửa bằng Nano Banana 2 trong không gian tạo ảnh, thổi chuyển động cho kết quả bằng Seedance 2.0 trong không gian tạo video, và thêm một đoạn nhạc ngắn trước khi xuất file. Đó chính là quy trình từ ảnh sang video mà Google vừa hé lộ cho Gemini, đang chạy ngay hôm nay trên các model đã có sẵn trong OmniArt.

Sẵn sàng sáng tạo?

Bắt đầu tạo nội dung tuyệt vời bằng AI

Bắt đầu miễn phí