tutorialHướng dẫn và cách làm11 phút đọc

MiniMax Music 2.6: tạo bài hát hoàn chỉnh có lời bằng AI

Hướng dẫn sử dụng MiniMax Music 2.6 trên OmniArt để tạo ra bài hát đầy đủ từ style prompt và lời bài hát — giọng hát, nhạc cụ nhiều lớp, mixing theo thể loại. Tạo nhạc AI từ A đến Z.

Đội ngũ OmniArt13 thg 6, 2026

Hầu hết các công cụ nhạc AI chỉ tạo ra một vòng lặp. MiniMax Music 2.6 tạo ra cả một bài hát — verse, chorus, bridge, và một màn trình diễn giọng hát có độ động thực sự. Ra mắt vào tháng 4 năm 2026, phiên bản 2.6 cải tiến so với thế hệ trước với âm trầm phong phú hơn, giọng hát tự nhiên hơn, và tốc độ tạo lần đầu nhanh hơn. Trên OmniArt, mỗi track tiêu tốn 40 credits, và hoạt động song song với các công cụ hình ảnh và video bạn đang dùng. Hướng dẫn này chỉ cho bạn cách viết style prompt và lời bài hát để biến một ô văn bản trống thành một track hoàn chỉnh có thể sử dụng ngay.

MiniMax Music 2.6 hoạt động như thế nào

Mô hình nhận hai đầu vào: style prompt mô tả thế giới âm thanh bạn muốn, và một khối lời bài hát tùy chọn được cấu trúc theo từng đoạn. Mô hình xử lý cả hai cùng nhau và xuất ra một tác phẩm hoàn chỉnh — không phải vòng lặp — với giọng hát, nhạc cụ nhiều lớp, và mixing theo thể loại được tích hợp sẵn.

Thế hệ 2.6 cải thiện những khía cạnh quan trọng nhất trong thực tế: bass ấm áp và rõ ràng hơn, màn trình diễn giọng hát sử dụng vibrato tự nhiên và biểu cảm cảm xúc thay vì lối đọc phẳng, và mô hình đạt đến bản nháp có thể dùng được nhanh hơn. Dòng MiniMax đã xây dựng danh tiếng về giọng hát AI chân thực; phiên bản 2.6 mở rộng điều đó với cách ngắt câu đáp lại cấu trúc lời bài hát bạn cung cấp.

Lời bài hát là tùy chọn. Để trống, mô hình sẽ tạo nhạc không lời từ style prompt. Cả hai cách đều được trình bày bên dưới.

Từ vựng cho style prompt

Style prompt là nơi bạn thiết lập hướng âm thanh. MiniMax Music 2.6 phản hồi tốt với các mô tả chính xác, nhiều lớp. Xây dựng prompt từ bốn chiều:

Thể loại và thể loại phụ Bắt đầu cụ thể. "Lo-fi hip-hop" hiệu quả hơn "hip-hop"; "cinematic orchestral" cho kết quả khác "orchestra". Từ ngữ hiệu quả: indie pop, dark ambient, synthwave, R&B ballad, neo-soul, folk acoustic, Latin trap, jazz fusion, post-rock, chillout electronic.

Tâm trạng và hướng cảm xúc Đặt tên cảm giác bạn muốn người nghe đạt được. Từ ngữ hiệu quả: melancholic, uplifting, tense, nostalgic, euphoric, intimate, cinematic, playful, brooding, hopeful, anthemic.

Nhịp độ và năng lượng Bạn không có điều khiển BPM, vì vậy hãy mô tả nhịp độ bằng ngôn ngữ: slow-burning, mid-tempo groove, driving rhythm, relaxed pulse, pulsing and urgent, gentle and unhurried.

Nhạc cụ và kết cấu âm thanh Liệt kê những âm thanh tạo nên cốt lõi của tác phẩm. Từ ngữ: warm electric piano, fingerpicked acoustic guitar, punchy drum machine, lush string pads, sub bass, muted trumpet, shimmering reverb guitar, 808 kick, close-mic piano, airy synth pads.

Phong cách giọng hát Mô tả điều bạn muốn từ màn trình diễn: female lead with warm alto, breathy indie vocal, raspy male lead, harmonized background vocals, conversational delivery, belted chorus, whispered verse.

Một style prompt kết hợp cả năm chiều cho mô hình một brief rõ ràng. Một prompt mơ hồ ("nhạc thư giãn") tạo ra kết quả mơ hồ.

Cấu trúc lời bài hát bằng thẻ đoạn

MiniMax Music 2.6 sử dụng thẻ đoạn để hiểu cấu trúc bài hát thay đổi ở đâu. Bao mỗi đoạn trong dấu ngoặc vuông:

[verse] — đoạn tự sự, năng lượng thấp, thiết lập bối cảnh
[chorus] — đoạn hook, cường độ cảm xúc cao nhất, lặp lại
[bridge] — đoạn phá vỡ mẫu verse/chorus, thêm sự tương phản
[pre-chorus] — dẫn vào chorus, tùy chọn
[outro] — đoạn kết, có thể lặp chorus hoặc kết thúc nhẹ nhàng

Viết lời như bạn viết cho một bài hát thực. Sơ đồ vần, độ dài dòng và mật độ thông tin đều ảnh hưởng đến cách mô hình trình diễn. Lời verse dày đặc phù hợp với phong cách trình bày chậm, có chủ ý hơn; những dòng ngắn, mạnh mẽ trong chorus tạo ra đà.

Mẹo

Giữ các dòng chorus ngắn và lặp lại. Mô hình coi sự lặp lại là tín hiệu để tăng cường độ trình diễn — một chorus với cụm từ hook lặp lại sẽ đổ năng lượng mạnh hơn chorus giới thiệu thông tin mới ở mỗi dòng.

Ví dụ thực tế

Ví dụ 1: indie pop cho intro video dạng ngắn

Style prompt:

Indie pop, nostalgic and warm, mid-tempo groove, fingerpicked acoustic guitar with light electric piano, soft drum machine, female lead with breathy delivery, harmonized background vocals in the chorus, airy reverb tail throughout.

Lời bài hát:

[verse]
Coffee going cold beside the window seat
Morning light is slipping through the leaves
I keep the photos in a box below the bed
Hold onto the versions of us I never said

[chorus]
We were golden, we were almost right
Dancing slow through an ordinary night
Golden, almost right
I'd do it all again if I could

[bridge]
Maybe that's enough, to have held it for a while
Maybe that's enough, to have meant it when I smiled

Sự kết hợp này tạo ra một track nhẹ nhàng, mang nỗi nhớ phù hợp cho montage, intro sản phẩm, hoặc nhạc mở đầu podcast. Phần nhạc cụ thưa thớt để lại không gian cho lời thoại hoặc voiceover được xếp chồng lên trên.

Ví dụ 2: nhạc nền năng lượng thương hiệu cho chỉnh sửa mạng xã hội

Style prompt:

Upbeat electronic pop, euphoric and driving, pulsing synth bass, punchy four-on-the-floor kick, shimmering synth pads, short instrumental drops, anthemic energy, no lead vocals — instrumental only.

Lời bài hát: (để trống — chế độ nhạc không lời)

Dùng cho reels, đoạn cắt ra mắt sản phẩm, hoặc highlight reel nơi âm nhạc mang năng lượng mà không cạnh tranh với văn bản trên màn hình. Ghi chú "no lead vocals — instrumental only" trong style prompt củng cố con đường nhạc không lời ngay cả khi không có lời.

Ví dụ 3: track R&B cho dự án creator

Style prompt:

Contemporary R&B, intimate and late-night, slow-burning mid-tempo, warm sub bass, Rhodes electric piano, brushed snare, male lead with smooth tenor delivery, conversational verse and belted chorus, lush string pads in the bridge.

Lời bài hát:

[verse]
Caught me off guard with a message at midnight
Said you've been thinking and you don't know why
I've been here doing the same thing, you know
Watching the city lights flicker and go

[pre-chorus]
Tell me what you're holding back
I've got time, I've got patience, and I've got your back

[chorus]
Stay a little longer in the conversation
Don't rush the feeling, let it find its way
Stay a little longer
We don't need a reason
Just you, just me, just the end of the day

[bridge]
There's something quiet in the space between us
Something neither of us wants to name
But here we are
Here we are

Các thẻ đoạn có cấu trúc cho mô hình các tín hiệu rõ ràng: verse năng lượng thấp, pre-chorus xây dựng, hook chorus lặp lại mở, và bridge với những dòng ngắn tạo sự tương phản. Điều này tạo ra một track có thể dùng làm nhạc nền cho nội dung phim ngắn, kể chuyện thương hiệu, hoặc phát hành độc lập của creator.

Chế độ nhạc không lời

Để trống trường lời bài hát (hoặc bật chế độ nhạc không lời) cho mô hình biết cần tạo ra một tác phẩm hoàn chỉnh từ style prompt. Track chỉ có nhạc cụ phù hợp nhất cho:

Intro và outro podcast — thiết lập tông mà không tranh chấp với lời nói
Nhạc nền video — đặt dưới lời thoại hoặc narration mà không gây xao nhãng
Reels thương hiệu và sản phẩm — những cắt và chuyển cảnh động nơi lời bài hát trở thành tiếng ồn
Nội dung ambient và lo-fi — nghe lâu mà không mệt mỏi giọng hát

Ở chế độ nhạc không lời, style prompt làm toàn bộ công việc sáng tác, vì vậy hãy dành thêm thời gian cho nó. Đặt tên nhạc cụ cụ thể, kết cấu âm thanh, và cung bậc bạn muốn — "xây dựng từ piano thưa thớt đến dàn nhạc đầy đủ" hoặc "giữ tối giản xuyên suốt, không có bộ gõ". Mô hình tôn trọng những tín hiệu định hướng này.

Ghi chú

Nếu bạn mô tả phong cách giọng hát trong style prompt nhưng để trống lời bài hát, mô hình vẫn có thể tạo ra track thiên về giọng hát với vocals không lời hoặc giai điệu hum. Để tránh điều này, hãy nêu rõ "instrumental only" hoặc "no vocals" trong style prompt khi bạn muốn output thuần nhạc cụ.

MiniMax Music 2.6 trong quy trình làm việc của creator

Nội dung mạng xã hội và video dạng ngắn

Tạo track mới cho từng lô video thay vì tái sử dụng nhạc thư viện. Một track 40 credits phù hợp với brief — đúng thể loại, đúng năng lượng, đúng độ dài — hiệu quả hơn âm thanh stock gần như phù hợp. Dùng con đường nhạc không lời cho reels khi bạn đang xếp chồng văn bản hoặc voiceover.

Sản xuất video và podcast

Kết hợp tạo nhạc với các công cụ audio và video khác của OmniArt trong cùng một phiên làm việc. Tạo voiceover với mô hình MiniMax Speech, tạo nhạc nền với MiniMax Music 2.6, và ghép cả hai vào clip video — mà không cần rời khỏi nền tảng. Xem AI voiceover cho video YouTube cho nửa quy trình voiceover đó.

Âm thanh thương hiệu

Nhạc thương hiệu — sting intro 5 giây, vòng lặp 15 giây cho landing page, track 30 giây cho quảng cáo — đều theo cùng quy trình. Viết style prompt mô tả tính cách thương hiệu (không chỉ thể loại), tạo ba hoặc bốn phiên bản, và chọn cái phù hợp nhất. Bạn không bị ràng buộc với một track thư viện duy nhất; bạn có thể tạo lại bất cứ lúc nào brief thay đổi.

So sánh với các mô hình nhạc khác trên OmniArt

Không gian làm việc audio của OmniArt bao gồm ba mô hình nhạc. Mỗi mô hình phù hợp nhất với brief khác nhau:

Mô hình	Hỗ trợ lời	Credits	Phù hợp nhất cho
MiniMax Music 2.6	Có	40	Bài hát đầy đủ có giọng hát; mọi thể loại; cũng hỗ trợ nhạc không lời
ElevenLabs Music	Có	150	Nhạc có cấu trúc đoạn rõ ràng và phối khí phong phú
Google Lyria 3 Pro	Không	20	Nhạc không lời chất lượng cao và nhạc phim

MiniMax Music 2.6 là điểm khởi đầu mặc định cho bất kỳ brief nào liên quan đến màn trình diễn giọng hát hoặc cung bậc bài hát đầy đủ. Lyria 3 Pro phù hợp khi bạn muốn nhạc phim chất lượng cao với chi phí thấp. ElevenLabs Music phù hợp với brief nơi cấu trúc phối khí và độ trung thực đoạn quan trọng hơn số credits.

Để biết về hiệu ứng âm thanh, tiếng nền, và voiceover cùng với nhạc, xem tổng quan mô hình audio đầy đủ.

Bắt đầu trên OmniArt

Mở không gian làm việc audio và chọn tab Nhạc. Chọn MiniMax Music 2.6, viết style prompt từ từ vựng ở trên, và dán lời có cấu trúc nếu bạn muốn track có giọng hát. Tạo hai hoặc ba lần, nghe thử, và tinh chỉnh prompt cho lần tiếp theo. Khoảng cách giữa brief thô và track có thể dùng thường chỉ cần một hoặc hai lần lặp lại — output của mô hình với prompt được viết tốt đủ gần để hoàn thiện đến mức công việc chính là chọn lựa, không phải sửa chữa.

Sẵn sàng sáng tạo?

Bắt đầu tạo nội dung tuyệt vời bằng AI

Bắt đầu miễn phí