MiniMax Music 2.6: como gerar músicas completas com letra
Aprenda a usar o MiniMax Music 2.6 no OmniArt para transformar um prompt de estilo e letra em uma música completa — vocais, instrumentação em camadas e mixagem por gênero.

A maioria das ferramentas de música com IA entrega um loop. O MiniMax Music 2.6 entrega uma música de verdade — verso, refrão, bridge e uma performance vocal com dinâmica real. Lançada em abril de 2026, a versão 2.6 melhora a anterior com graves mais ricos, entrega vocal mais natural e geração inicial mais rápida. No OmniArt, ele roda de graça, a 40 créditos por faixa, e convive com as ferramentas de imagem e vídeo que você já usa. Este guia mostra como escrever o prompt de estilo e a letra que transformam uma caixa de texto em branco em uma faixa finalizada que você pode realmente usar.
Como o MiniMax Music 2.6 funciona
O modelo recebe duas entradas: um prompt de estilo que descreve o universo sonoro que você quer, e um bloco de letra opcional que fornece as palavras, estruturadas em seções. Ele processa os dois juntos e gera uma peça completa — não um loop — com vocais, instrumentação em camadas e mixagem por gênero já incorporados.
A geração 2.6 melhora as áreas que mais importam na prática: o grave está mais quente e definido, as performances vocais usam vibrato natural e moldagem emocional em vez de uma entrega plana, e o modelo chega a um rascunho utilizável mais rápido. A família MiniMax construiu uma reputação por vocais de IA realistas; a 2.6 estende isso com fraseado que responde à estrutura de letra que você fornece.
A letra é opcional. Deixe-a de fora e o modelo gera música instrumental a partir do prompt de estilo sozinho. Ambos os caminhos são abordados abaixo.
Vocabulário do prompt de estilo
O prompt de estilo é onde você define a direção sonora. O MiniMax Music 2.6 responde bem a descrições precisas e em camadas. Construa o seu a partir de quatro dimensões:
Gênero e subgênero
Seja específico. "Lo-fi hip-hop" é melhor que "hip-hop"; "orquestral cinemático" cai diferente de "orquestra." Termos que funcionam: indie pop, dark ambient, synthwave, R&B ballad, neo-soul, folk acoustic, Latin trap, jazz fusion, post-rock, chillout electronic.
Clima e direção emocional
Nomeie o sentimento que você quer que o ouvinte chegue. Termos que funcionam: melancólico, animador, tenso, nostálgico, eufórico, íntimo, cinemático, lúdico, sombrio, esperançoso, grandioso.
Andamento e energia
Você não tem controles de BPM, então descreva o andamento em linguagem: ritmo lento e gradual, groove de andamento médio, ritmo pulsante, pulso relaxado, urgente e pulsante, suave e sem pressa.
Instrumentação e textura
Liste os sons que ancoram a peça. Termos: piano elétrico quente, violão fingerpicked, caixa de ritmos marcante, cordas suaves e cheias, sub bass, trompete com surdina, guitarra com reverb cintilante, 808 kick, piano de microfone próximo, pads de sintetizador etéreos.
Estilo vocal
Descreva o que você quer da performance: voz feminina com contralto quente, vocal indie suave, voz masculina rouca, vocais de fundo em harmonia, entrega conversacional, refrão gritado, verso sussurrado.
Um prompt de estilo que combina todos os cinco dá ao modelo uma orientação clara. Um vago ("música relaxante") produz um resultado vago.
Estruturando a letra com tags de seção
O MiniMax Music 2.6 usa tags de seção para entender onde uma música muda de estrutura. Envolva cada seção em colchetes:
[verse]— seções narrativas, energia mais baixa, estabelece contexto[chorus]— o gancho, maior intensidade emocional, se repete[bridge]— uma seção que quebra o padrão verso/refrão, adiciona contraste[pre-chorus]— constrói para o refrão, opcional[outro]— seção de encerramento, pode repetir o refrão ou diminuir gradualmente
Escreva a letra como faria para uma música de verdade. Esquema de rima, comprimento de linha e densidade afetam como o modelo as performa. Letras de verso mais densas combinam com uma entrega mais lenta e deliberada; linhas curtas e marcantes num refrão impulsionam o momentum.
Dica
Exemplos práticos
Exemplo 1: indie pop para introdução de vídeo curto
Prompt de estilo:
Indie pop, nostálgico e quente, groove de andamento médio, violão fingerpicked com piano elétrico suave, caixa de ritmos soft, voz feminina com entrega suave, vocais de fundo em harmonia no refrão, cauda de reverb etérea em toda a faixa.
Letra:
[verse]
Coffee going cold beside the window seat
Morning light is slipping through the leaves
I keep the photos in a box below the bed
Hold onto the versions of us I never said
[chorus]
We were golden, we were almost right
Dancing slow through an ordinary night
Golden, almost right
I'd do it all again if I could
[bridge]
Maybe that's enough, to have held it for a while
Maybe that's enough, to have meant it when I smiled
Essa combinação gera uma faixa mellow e nostálgica adequada para uma montagem, introdução de produto ou abertura de podcast. A instrumentação esparsa deixa espaço para diálogo ou narração sobrepostos.
Exemplo 2: trilha energética de marca para edições de redes sociais
Prompt de estilo:
Pop eletrônico animado, eufórico e pulsante, baixo de sintetizador pulsante, kick quatro por quatro marcante, pads de sintetizador cintilantes, quedas instrumentais curtas, energia grandiosa, sem vocais principais — apenas instrumental.
Letra: (deixar vazio — modo instrumental)
Use isso para reels, cortes de revelação de produto ou edições de destaque onde a música carrega energia sem competir com o texto na tela. A nota "sem vocais principais — apenas instrumental" no prompt de estilo reforça o caminho instrumental do modelo mesmo sem letra.
Exemplo 3: faixa R&B para projeto de criador de conteúdo
Prompt de estilo:
R&B contemporâneo, íntimo e noturno, andamento médio lento, sub bass quente, piano Rhodes elétrico, caixa com escova, voz masculina com entrega suave de tenor, verso conversacional e refrão aberto, pads de cordas luxuosos na bridge.
Letra:
[verse]
Caught me off guard with a message at midnight
Said you've been thinking and you don't know why
I've been here doing the same thing, you know
Watching the city lights flicker and go
[pre-chorus]
Tell me what you're holding back
I've got time, I've got patience, and I've got your back
[chorus]
Stay a little longer in the conversation
Don't rush the feeling, let it find its way
Stay a little longer
We don't need a reason
Just you, just me, just the end of the day
[bridge]
There's something quiet in the space between us
Something neither of us wants to name
But here we are
Here we are
As tags de seção estruturadas dão ao modelo orientações claras: verso de baixa energia, pré-refrão crescente, um gancho de refrão aberto e repetitivo, e uma bridge com linhas curtas e marcantes para contraste. Isso resulta em uma faixa utilizável como plano de fundo para conteúdo de curta-metragem, narrativa de marca ou lançamento independente de criador.
Modo instrumental
Deixar o campo de letra vazio (ou ativar o modo instrumental) diz ao modelo para gerar uma peça completa a partir do prompt de estilo sozinho. Faixas apenas instrumentais são bem adequadas para:
- Intros e outros de podcast — definem o tom sem que a letra concorra com a fala
- Fundos de vídeo — ficam sob diálogo ou narração sem distrair
- Reels de marca e produto — cortes cinéticos e transições onde a letra aparece como ruído
- Conteúdo ambiente e lo-fi — escuta de longa duração sem fadiga vocal
No modo instrumental, o prompt de estilo faz todo o trabalho composicional, então dedique mais tempo a ele. Nomeie os instrumentos específicos, a textura e o arco que você quer — "constrói de piano esparso para arranjo completo" ou "permanece mínimo ao longo de toda a faixa, sem percussão." O modelo respeita essas orientações direcionais.
Nota
MiniMax Music 2.6 em um fluxo de trabalho de criador
Conteúdo para redes sociais e formato curto
Gere uma faixa por lote de vídeos em vez de reutilizar música de biblioteca. Uma faixa de 40 créditos que corresponde ao briefing — gênero certo, energia certa, duração certa — funciona melhor do que áudio de estoque que quase encaixa. Use o caminho instrumental para reels onde você está sobrepondo texto ou narração.
Produção de vídeo e podcast
Combine a geração de música com as outras ferramentas de áudio e vídeo do OmniArt na mesma sessão. Gere uma narração com um modelo MiniMax Speech, gere uma trilha de fundo com o MiniMax Music 2.6, e corte os dois no clipe de vídeo — sem sair da plataforma. Veja narração com IA para vídeos do YouTube para a metade de narração desse fluxo de trabalho.
Áudio de marca
Trilhas de áudio de marca — um sting de introdução de 5 segundos, um loop de 15 segundos para uma landing page, uma faixa de 30 segundos para um anúncio — seguem o mesmo processo. Escreva um prompt de estilo que descreva o caráter da marca (não só o gênero), gere três ou quatro versões e escolha a que melhor se encaixa. Você não está se comprometendo com uma única faixa de biblioteca; pode gerar novamente a qualquer momento que o briefing mude.
Como ele se compara a outros modelos de música no OmniArt
O espaço de trabalho de áudio do OmniArt inclui três modelos de música. Cada um vence em um briefing diferente:
| Modelo | Suporte a letra | Créditos | Melhor para |
|---|---|---|---|
| MiniMax Music 2.6 | Sim | 40 | Músicas completas com vocais; qualquer gênero; instrumental também |
| ElevenLabs Music | Sim | 150 | Música estruturada e orientada por seções com arranjo rico |
| Google Lyria 3 Pro | Não | 20 | Instrumental de alta qualidade e trilhas cinemáticas |
O MiniMax Music 2.6 é o ponto de partida padrão para qualquer briefing que envolva uma performance vocal ou um arco de música completo. O Lyria 3 Pro é a escolha certa para uma trilha cinemática instrumental onde você quer alta qualidade a baixo custo. O ElevenLabs Music é indicado para briefings onde a estrutura do arranjo e a fidelidade de seção importam mais do que a contagem de créditos.
Para efeitos sonoros, ambientação e narração junto com música, veja a visão geral completa dos modelos de áudio.
Como começar no OmniArt
Abra o espaço de trabalho de áudio e selecione a aba Music. Escolha MiniMax Music 2.6, escreva um prompt de estilo com o vocabulário acima e cole a letra estruturada se quiser uma faixa com vocal. Gere duas ou três versões, audição-as e refine o prompt para a próxima rodada. A distância entre um briefing bruto e uma faixa utilizável geralmente é uma ou duas iterações — a saída do modelo com um prompt bem escrito é próxima o suficiente do resultado final que o principal trabalho é escolher, não corrigir.
Pronto para criar?
Comece a gerar conteúdo incrível com IA