Cách viết prompt cho Nano Banana 2 Lite để có ảnh nhanh, nét
Nano Banana 2 Lite đánh đổi độ dư để lấy tốc độ. Đây là cách điều chỉnh ảnh tham chiếu, độ phân giải và cấu trúc prompt để có kết quả chất lượng cao cấp thật nhanh.

Google công bố Nano Banana 2 Lite ngày 30 tháng 6 năm 2026 — gemini-3.1-flash-lite-image, model nhanh nhất và rẻ nhất trong dòng ảnh Gemini. Model này tạo một ảnh 1K trong khoảng 4 giây với giá $0,034, nhanh hơn Nano Banana 2 khoảng 2,7 lần, và vẫn đứng ở vị trí #5 tổng thể trên bảng xếp hạng Text-to-Image Arena của Arena.ai với điểm Elo gần 1.251. Viết prompt tốt cho model này không phải là bù đắp cho một model yếu hơn, mà là hiểu chính xác những gì đã thay đổi.
Ghi chú
Tính đến thời điểm viết bài (1 tháng 7 năm 2026), Nano Banana 2 Lite chỉ khả dụng qua Google AI Studio và Gemini API — model này chưa có mặt trong danh sách model của OmniArt. Toàn bộ các phần hướng dẫn viết prompt bên dưới mô tả việc làm việc trực tiếp với công cụ của Google. Phần cuối bài sẽ chỉ ra kỹ thuật nào trong số này áp dụng được cho Nano Banana 2, model đang hoạt động trên OmniArt hôm nay.
Tốc độ và giá không phải là những thứ duy nhất thay đổi ở hạng Lite. Độ phân giải giảm xuống, Google Search grounding biến mất, và — trái ngược với suy đoán thông thường — trần số ảnh tham chiếu lại tăng lên. Để có kết quả nhanh và sắc nét, bạn cần hiểu đánh đổi nào thực sự quan trọng với công việc của mình, và thói quen viết prompt nào có thể bù đắp cho những đánh đổi đó.
Những gì thực sự thay đổi ở hạng Lite
| Thông số | Nano Banana 2 Lite | Nano Banana 2 |
|---|---|---|
| API id | gemini-3.1-flash-lite-image | gemini-3.1-flash-image |
| Tốc độ tạo | ~4 giây | Chậm hơn ~2,7 lần |
| Giá (ảnh 1K) | $0,034 | $0,067 tiêu chuẩn / $0,034 theo lô |
| Độ phân giải tối đa | 1K (chỉ 0.5K, 1K) | Tới 4K |
| Ảnh tham chiếu/vật thể | Tới 14 ảnh | 10 vật thể + 4 nhân vật |
| Google Search grounding | Không | Có |
| Xếp hạng Arena.ai Text-to-Image | #5 tổng thể, điểm Elo ~1.251 | Chưa công bố ở đây |
| Có trên OmniArt | Chưa | Có |
Có hai con số đáng để dừng lại suy ngẫm. Mức $0,034 cho một ảnh 1K của Lite bằng đúng giá theo lô của Nano Banana 2, và chỉ bằng một nửa giá tiêu chuẩn — nhưng ở tốc độ tạo theo thời gian thực, không phải thời gian xử lý theo lô. Và dù là hạng giá rẻ, Lite vẫn giữ được những yếu tố thực sự quyết định một ảnh có dùng được hay không: độ nhất quán của nhân vật, mức bám sát prompt, và chữ rõ nét trong ảnh. Cách Google định vị chính hạng này là "không đánh đổi chất lượng" ở mức tốc độ và giá này, với độ phân giải là giới hạn thực sự duy nhất.
Chế độ suy luận cũng được bật mặc định ở hạng này, điều khiển qua thinking_level: minimal hoặc high. Mức suy luận cao hơn sẽ tạo các bản dựng bố cục thử nghiệm trước khi cho ra ảnh cuối cùng — đáng để tốn thêm một phần nhỏ của giây với những prompt có nhiều yếu tố cần khớp với nhau. Hỗ trợ tỷ lệ khung hình không đổi so với phần còn lại của dòng model: 1:1, 3:2, 2:3, 3:4, 4:3, 4:5, 5:4, 9:16, 16:9 và 21:9 đều khả dụng, vì vậy khung hình nên nằm ngay trong prompt chứ không phải một ý nghĩ thêm vào sau.
Điều bất ngờ: nhiều ảnh tham chiếu hơn, không phải ít hơn
Trực giác thông thường với một model "lite" là mọi thông số đều bị giảm xuống. Nhưng ảnh tham chiếu lại phá vỡ quy luật đó. Nano Banana 2 Lite nhận tới 14 ảnh tham chiếu hoặc ảnh vật thể cho mỗi lượt tạo — nhiều hơn giới hạn 10 ảnh vật thể cộng 4 ảnh nhân vật của Nano Banana 2.
Điều đó khiến Lite trở thành lựa chọn thực sự mạnh cho những công việc xoay quanh một bộ tham chiếu lớn: một dòng sản phẩm với cả chục SKU, một bảng nhân vật với nhiều biến thể trang phục hay đạo cụ, một bộ nhận diện thương hiệu với nhiều cách trình bày logo cần xuất hiện cùng nhau và giữ nhất quán. Bạn từ bỏ độ phân giải cao nhất, nhưng đổi lại có thêm dư địa ở chính loại đầu vào quyết định liệu một lượt tạo nhiều ảnh tham chiếu có ăn khớp với nhau hay không. Nếu một công việc cần hơn mười ảnh tham chiếu và không cần đầu ra 4K, Lite là công cụ phù hợp hơn, không phải một sự thỏa hiệp.
Một mẫu prompt phù hợp với hạng này
Hướng dẫn của Google cho Nano Banana 2 Lite nhất quán với cách toàn bộ dòng ảnh Gemini phản hồi: chi tiết phong phú, cụ thể giúp tăng khả năng kiểm soát, và một cấu trúc theo mẫu luôn cho kết quả tốt hơn một danh sách từ khóa rời rạc. Năm mục sau đây đáp ứng gần như mọi yêu cầu sáng tạo:
[Shot type] of [specific subject with descriptive detail], in [setting],
lit by [lighting direction and quality], shot from [camera angle / lens
characteristic]. [Style descriptor: medium + visual qualities].
Hãy rà qua như một danh sách kiểm tra trước khi gửi bất kỳ prompt nào:
- Loại khung hình — cận cảnh, ảnh sản phẩm ba phần tư, cảnh toàn rộng thiết lập bối cảnh. Đừng để model tự đoán khung hình.
- Chủ thể — cụ thể, không chung chung. "Một thợ gốm 34 tuổi với cánh tay dính bột" luôn tốt hơn "một người".
- Bối cảnh — ở đâu và khi nào, kể cả những gì quan trọng xuất hiện trong nền.
- Ánh sáng — hướng, chất lượng và nhiệt độ màu. "Ánh sáng cửa sổ dịu từ bên trái" cho ra một ảnh khác hẳn so với "đèn huỳnh quang gắt từ trên xuống".
- Góc máy / ống kính — ngang tầm mắt so với góc thấp, 35mm so với macro. Yếu tố này đóng góp cho bố cục nhiều hơn hầu hết prompt vẫn nghĩ.
- Mô tả phong cách — nêu rõ chất liệu (ảnh chụp, màu nước, render 3D) và các đặc điểm thị giác (hạt phim, hoàn thiện studio bóng mượt) bạn muốn; các mô tả này là thứ giữ một loạt biến thể nhất quán với nhau.
Đây là cấu trúc tương tự hoạt động tốt trên mọi hạng ảnh Gemini — chỉ khác là ở tốc độ khoảng 4 giây mỗi lượt tạo, bạn hoàn toàn có thể chạy mẫu này năm sáu lần, mỗi lần đổi một mục, rồi chọn kết quả tốt nhất, thay vì phải tinh chỉnh thủ công một prompt duy nhất.
Năm prompt nên thử
-
Ảnh chủ đạo sản phẩm, một ảnh tham chiếu. "Three-quarter product shot of a matte-ceramic white sneaker on a slate-gray pedestal, softbox key light from top-left with a subtle rim light from behind, 50mm macro lens, shallow depth of field, editorial product-catalog style, no props." Với giá $0,034 và ~4 giây mỗi khung hình, mười biến thể góc chụp tốn ít chi phí hơn một vòng chỉnh sửa duy nhất trên một model chậm hơn.
-
Nhất quán đa tham chiếu, thử trần 14 ảnh. "Using the attached reference set, generate a three-quarter studio portrait of the same character in a pose and lighting that match the references. Keep facial features, outfit, and color palette identical to the reference images; change only the background to a warm gradient studio backdrop." Đây chính là công việc mà dư địa ảnh tham chiếu của Lite sinh ra để phục vụ.
-
Chân dung phong cách biên tập, thinking_level ở mức high. "Candid editorial portrait of an elderly luthier in his workshop, golden-hour light through a dusty window, 85mm lens, shallow depth of field, natural film grain, documentary photography style." Những cảnh phức tạp sẽ hưởng lợi khi nâng
thinking_levellênhigh— bước dựng bố cục trung gian phát huy tác dụng khi một yêu cầu có nhiều phần cần khớp với nhau. -
Biến thể mạng xã hội nhanh, thinking_level ở mức minimal. "Flat-lay of a matcha latte and a linen napkin on a marble countertop, soft overhead daylight, top-down angle, minimal aesthetic, muted pastel palette." Với nội dung số lượng lớn, độ phức tạp thấp, mức suy luận minimal giữ tốc độ xử lý cao mà không làm giảm chất lượng bố cục.
-
Kiểm tra giới hạn mô tả phong cách. "Watercolor illustration of a lighthouse on a rocky coast at dusk, visible paper texture, loose wet-on-wet washes, muted indigo and rust palette, hand-lettered caption area left blank." Nêu rõ chất liệu và kỹ thuật cụ thể — không chỉ dừng ở "phong cách màu nước" — giúp cả loạt ảnh giữ được sự nhất quán về thị giác.
Chỉnh sửa qua nhiều lượt mà không cần viết lại prompt từ đầu
Nano Banana 2 Lite hỗ trợ tinh chỉnh lặp lại qua previous_interaction_id — bạn tham chiếu tới lượt tạo trước đó thay vì mô tả lại toàn bộ cảnh. Một luồng hội thoại điển hình:
- Lượt 1: Tạo ảnh gốc bằng một prompt đầy đủ.
- Lượt 2: "Using the previous generation, change the jacket color to burgundy and add rain-soaked reflections on the pavement."
- Lượt 3: "Zoom to a tighter three-quarter crop and warm the color grade slightly."
Mỗi lượt chỉ cần mô tả phần thay đổi, không cần mô tả lại toàn bộ cảnh — biến tốc độ của Lite thành một vòng lặp tinh chỉnh thực sự, thay vì ba prompt khởi động lại từ đầu riêng biệt.
Chỉ dẫn bảo toàn giúp giữ nguyên những gì bạn không muốn thay đổi
Lỗi thường gặp nhất khi chỉnh sửa lặp lại là phạm vi thay đổi lan rộng ngoài ý muốn: bạn yêu cầu một thay đổi nhưng nhận về ba. Chỉ dẫn bảo toàn rõ ràng sẽ khắc phục điều này. Thêm một mệnh đề như "giữ nguyên nền" hay "giữ nguyên tư thế và biểu cảm của chủ thể" vào bất kỳ lượt chỉnh sửa nào, và model sẽ coi đó là một ràng buộc bắt buộc chứ không phải một gợi ý.
Mẹo
Hãy đặt mệnh đề bảo toàn ở cuối prompt, sau phần thay đổi bạn yêu cầu. "Change the jacket to burgundy; keep the background, pose, and lighting unchanged" cho kết quả đáng tin cậy hơn so với việc đặt ràng buộc lên đầu.
Những điểm Nano Banana 2 Lite vẫn còn thua kém
Có hai giới hạn đáng để tính toán trước. Độ phân giải chỉ đạt tối đa 1K — 0.5K và 1K là hai đầu ra duy nhất, không có đường lên 2K hay 4K — nên công việc in ấn khổ lớn hay biển quảng cáo ngoài trời nên chuyển sang một hạng cao hơn. Và Lite không hỗ trợ Google Search grounding, nên những prompt dựa vào sự kiện thời sự hay dữ liệu trực tiếp sẽ không được đối chiếu với thông tin thực tế nào cả; hãy chuyển những prompt đó sang một model khác, hoặc kết hợp với việc kiểm tra thông tin thủ công.
Kỹ thuật nào áp dụng được cho Nano Banana 2 trên OmniArt hôm nay
Đây là phần quan trọng nếu bạn chưa có quyền truy cập Lite. Nano Banana 2 (gemini-3.1-flash) đang hoạt động trên không gian tạo ảnh của OmniArt, gắn nhãn mới và nổi bật, và chia sẻ đủ nhiều "ngữ pháp" prompt với Lite để phần lớn nội dung trên đây áp dụng trực tiếp được.
| Kỹ thuật | Áp dụng cho Nano Banana 2 trên OmniArt |
|---|---|
| Mẫu khung hình / chủ thể / bối cảnh / ánh sáng / camera | Có — cùng cấu trúc prompt hoạt động không đổi |
| Mô tả phong cách (chất liệu + đặc điểm thị giác) | Có |
| Chỉ dẫn bảo toàn ("giữ nguyên X") | Có |
| Nhất quán dựa trên ảnh tham chiếu | Có, nhưng nên xem trần 14 ảnh của Lite là thông số cấp API, chưa phải giới hạn đã xác nhận trên giao diện OmniArt |
Điều khiển thinking_level | Một tham số API riêng của Lite, hiện giao diện OmniArt chưa đưa ra như một tùy chọn có thể chỉnh |
| Trần độ phân giải chỉ 1K | Không áp dụng — Nano Banana 2 trên OmniArt đạt độ phân giải đầy đủ |
Nói cách khác, kỷ luật viết prompt mới là kỹ năng có thể mang theo, không phải các giới hạn cụ thể của từng hạng. Hãy rèn thói quen đi từ loại khung hình đến góc máy trên Nano Banana 2 ngay từ bây giờ, và nó sẽ được mang theo ngay khi Lite — hay bất kỳ hạng nào trong tương lai — xuất hiện trên không gian làm việc.
Để xem bảng so sánh chi tiết cả ba hạng, xem Nano Banana 2 Lite, 2 hay Pro: nên chọn model Gemini nào?. Còn về phía video song hành với đợt ra mắt này, API Gemini Omni Flash dành cho nhà phát triển: điểm mới sau I/O nói về những gì Google đã ra mắt cùng lúc.
Câu hỏi thường gặp
Nano Banana 2 Lite đã có trên OmniArt chưa?
Chưa. Google công bố Nano Banana 2 Lite (gemini-3.1-flash-lite-image) ngày 30 tháng 6 năm 2026, và hiện chỉ khả dụng qua Google AI Studio và Gemini API. Nano Banana 2, hạng ngay phía trên, đang hoạt động trên OmniArt hôm nay.
Nano Banana 2 Lite và Nano Banana 2 khác nhau thực sự ở đâu?
Chủ yếu là tốc độ và độ phân giải. Lite tạo ảnh trong khoảng 4 giây, so với thời gian dài hơn khoảng 2,7 lần của Nano Banana 2, với giá $0,034 cho mỗi ảnh 1K. Đổi lại, Lite giới hạn ở độ phân giải 1K — không có 2K hay 4K — và không hỗ trợ Google Search grounding.
Vì sao hạng "lite" lại hỗ trợ nhiều ảnh tham chiếu hơn cả hạng cao cấp nhất?
Đây là một đánh đổi thực sự, không phải một thiếu sót. Lite nhận tới 14 ảnh tham chiếu hoặc ảnh vật thể cho mỗi lượt tạo, so với 10 ảnh vật thể cộng 4 ảnh nhân vật của Nano Banana 2. Nếu một công việc phụ thuộc vào một bộ tham chiếu lớn nhiều hơn là phụ thuộc vào đầu ra 4K, Lite là công cụ phù hợp hơn.
Tôi có thể lấy đầu ra 4K từ Nano Banana 2 Lite không?
Không. Độ phân giải tối đa của Lite là 1K, với 0.5K và 1K là hai đầu ra duy nhất được hỗ trợ. Để có 2K hoặc 4K, hãy dùng Nano Banana 2 hoặc Nano Banana 2 Pro.
Nano Banana 2 Lite có hỗ trợ Google Search grounding không?
Không. Nano Banana 2 có hỗ trợ; Lite thì không. Những prompt phụ thuộc vào sự kiện thời sự hay dữ liệu trực tiếp nên chuyển sang một model có hỗ trợ grounding, hoặc kết hợp với việc kiểm tra thông tin thủ công.
Làm sao để chỉnh sửa qua nhiều lượt với Nano Banana 2 Lite?
Hãy tham chiếu tới lượt tạo trước đó bằng previous_interaction_id và chỉ mô tả thay đổi bạn muốn — đổi màu, crop lại, chỉnh ánh sáng. Kết hợp với một chỉ dẫn bảo toàn rõ ràng ("giữ nguyên nền") để ngăn model thay đổi những phần trong ảnh mà bạn không yêu cầu.
Bắt đầu trên OmniArt
Nano Banana 2 Lite chưa có trên không gian làm việc, nhưng kỷ luật viết prompt mà model này đề cao — chủ thể cụ thể, ánh sáng được nêu rõ, chỉ dẫn bảo toàn tường minh — chính xác là những gì giúp Nano Banana 2 trên OmniArt cho kết quả tốt hơn. Hãy mở không gian tạo ảnh, chạy mẫu prompt đi từ loại khung hình đến góc máy trên Nano Banana 2, và khi đã có một ảnh chủ đạo ưng ý, mang nó sang không gian tạo video với quy trình từ ảnh sản phẩm đến video. Để biết thêm về cấu trúc prompt trên nhiều model, xem cách viết prompt tốt hơn, và để xem so sánh đầy đủ với hạng cao cấp khác, GPT Image 2 hay Nano Banana 2: chọn model ảnh AI năm 2026.
Sẵn sàng sáng tạo?
Bắt đầu tạo nội dung tuyệt vời bằng AI