Seedance 2.0: pola prompt dan enam use case untuk video AI
Panduan kreator untuk Seedance 2.0 — input multi-referensi, output 2K native, timeline multi-shot, dan enam prompt teruji dengan hasil di OmniArt.

Seedance 2.0 adalah model yang dipilih kreator ketika brief terbaca seperti brief sutradara. ByteDance meluncurkannya pada Februari 2026 sebagai unified multimodal diffusion Transformer yang menerima teks, hingga sembilan gambar, tiga video referensi, dan tiga file audio dalam satu prompt — semuanya dapat ditarget dengan sintaks @image1 dan @video1. Hasilnya adalah jalur paling bersih menuju konsistensi karakter di timeline multi-shot yang tersedia saat ini. Panduan ini mencakup tata bahasa prompt yang menghormati model dan enam use case teruji beserta prompt dan hasilnya.
Apa itu Seedance 2.0
Seedance 2.0 menghasilkan klip 4–15 detik hingga 2K dengan audio stereo native. Sorotan utamanya bukan resolusi — melainkan arsitektur multi-referensi dan prompting timeline multi-shot.
| Spesifikasi | Nilai |
|---|---|
| Arsitektur | Unified multimodal diffusion Transformer |
| Resolusi maksimum | 2K |
| Durasi | 4–15 detik |
| Input gambar | hingga 9 (@image1–@image9) |
| Input video | hingga 3 (@video1–@video3) |
| Input audio | hingga 3 (@audio1–@audio3) |
| Output audio native | Ya — dialog, SFX, ambience, musik |
| Bahasa lip-sync | 7+ |
| Mode | Standard, Fast |
Mengapa sistem multi-referensi penting
Kebanyakan model video menerima satu referensi, atau tidak sama sekali. Seedance 2.0 menerima tumpukan referensi dan memungkinkan Anda mengikat masing-masing ke peran di dalam prompt. Gunakan @image1 untuk wajah karakter, @image2 untuk kostum, @image3 untuk lokasi, @video1 untuk gerakan kamera yang Anda inginkan, @audio1 untuk bed musik. Output menghormati masing-masing sebagai instruksi terpisah alih-alih meratakannya menjadi noise.
Itulah alasan praktis mengapa kemiripan karakter bertahan antar shot: referensi @image yang sama masuk ke setiap shot dalam timeline, dan model menggunakannya sebagai jangkar identitas alih-alih menyimpulkan ulang karakter dari prompt setiap kali.
Struktur prompt yang efektif
Seedance 2.0 merespons struktur enam bagian.
- Subjek — siapa atau apa yang ada di layar
- Aksi / gerakan — apa yang mereka lakukan
- Setting / lingkungan — di mana itu terjadi
- Gaya visual — referensi film, palet, era
- Arahan kamera — istilah sinematografi spesifik
- Pencahayaan — arah, kualitas, waktu dalam sehari
Template prompt yang baik:
"Subjek (dengan referensi
@image1jika berlaku). Aksi. Setting. Gaya visual. Arahan kamera (istilah sinematografi spesifik). Detail pencahayaan."
Notasi timeline multi-shot
Untuk pekerjaan multi-shot, tulis timeline langsung ke dalam prompt.
0–4s: wide establishing shot, karakter (di @image1) berjalan masuk ke adegan
4–8s: medium tracking shot mengikuti mereka melintasi ruangan
8–12s: orbit 360 derajat mengelilingi meja yang mereka capai
Sematkan @image1 yang sama di setiap segmen. Kemiripan tetap konsisten melewati cut.
Disiplin penandaan referensi
Aturan singkat yang terbayar:
- Gunakan
@image1,@image2untuk foto wajah dan product shot. - Gunakan
@video1untuk gerakan kamera yang ingin Anda salin. - Gunakan
@audio1ketika bed audio lebih penting daripada default model. - Referensikan setiap tag secara eksplisit dalam teks. Jangan andalkan model untuk menyimpulkan referensi mana yang memainkan peran apa.
Enam use case teruji beserta prompt
Setiap prompt di bawah ini telah kami jalankan di Seedance 2.0. Kolom hasil adalah apa yang kami dapatkan, dengan waktu generasi diukur pada Standard 720p.
1. Adegan film sinematik
"Seorang detektif pensiun dengan mantel gelap panjang berjalan melalui gang basah hujan di malam hari. Neon merah dan biru memantul di batu jalan yang basah. Ia berhenti, menyalakan rokok, dan melirik ke belakang. Slow push-in dari wide shot ke medium close-up. Gaya film noir, anamorphic lens flare, color grading teal-orange, grain film."
Hasil. Push-in kamera halus. Refleksi hujan meyakinkan, gerakan mantel natural. Penyalaan rokok dirender tanpa distorsi tangan. Audio hujan dan kota ambient tergenerasi sinkron. ~70 detik.
2. Iklan produk
"Botol parfum mewah berputar perlahan di permukaan marmer hitam. Cairan keemasan menangkap cahaya saat berputar. Partikel debu emas lembut melayang di udara di sekitarnya. Macro close-up, kamera orbit 360 derajat lambat. Pencahayaan studio dengan rim light hangat, gaya fotografi komersial high-end."
Hasil. Refraksi kaca dan perilaku cairan akurat. Partikel melayang natural. Rotasi penuh halus, sudut cahaya benar, tekstur marmer terlihat. ~65 detik.
3. Video musik
"Seorang penyanyi wanita dengan gaun sutra merah mengalir tampil di atap saat matahari terbenam. Skyline kota membentang di belakangnya. Angin menghembuskan rambut dan gaunnya secara dramatis. Ia bernyanyi dengan intensitas emosional, lengan terentang lebar. Dynamic tracking shot mengorbit di sekelilingnya. Golden hour backlighting, lens flare, nada hangat vibrant."
Hasil. Fisika gaun realistis. Orbit tracking fluid. Wajah tetap konsisten sepanjang rotasi. Gerakan rambut sesuai arah angin. Track musik ambient tergenerasi. ~75 detik.
4. Potret karakter bergerak
"Seorang pengrajin Jepang tua di bengkel kayu tradisional, cahaya pagi menembus layar kertas. Ia perlahan mengangkat mangkuk teh keramik tempa tangan, memeriksanya dengan kebanggaan tenang. Tangan berkerutnya memutar mangkuk dengan lembut. Close-up tangan, lalu slow tilt ke atas untuk menampilkan wajahnya. Estetika wabi-sabi, cahaya natural hangat, kualitas potret dokumenter."
Hasil. Jumlah jari benar. Gerakan sendi natural. Tilt halus dari tangan ke wajah. Cahaya realistis menembus layar. Suara ambient bengkel samar. Tekstur kulit realistis. ~80 detik.
5. Alam dan lanskap
"Aerial drone shot meluncur di atas lembah gunung berkabut saat matahari terbit. Lapisan kabut bergulung di antara puncak hijau zamrud. Sungai berkelok memantulkan cahaya pagi keemasan di bawah. Elang terbang melintasi frame setinggi mata. Smooth forward tracking dengan sedikit descent. Lanskap epik, volumetric fog, pencahayaan golden hour."
Hasil. Lapisan kabut independen menciptakan kedalaman meyakinkan. Refleksi sungai diperbarui dengan posisi kamera. Keseimbangan palet kuat. Volumetric fog dirender bersih. Audio angin dan kicau burung. ~55 detik — yang tercepat dari enam.
6. Anime dan fantasi
"Seorang putri warrior anime berdiri di atas tebing menghadap kota abad pertengahan yang terbakar di malam hari. Rambut perak panjang dan jubah crimson-nya berkibar tertiup angin. Ia menarik katana biru bercahaya, listrik berderak sepanjang bilah. Kelopak sakura berputar di sekelilingnya. Dynamic low-angle shot dengan slow push-in. Gaya cel-shading, aksen neon vibrant, speed lines dramatis."
Hasil. Cel-shading konsisten sepanjang klip. Tarikan katana fluid. Efek listrik terintegrasi natural. Kelopak sakura bergerak independen. Interaksi cahaya api dengan jubah. Audio sword swoosh dramatis. ~70 detik.
Kesalahan umum dan perbaikannya
| Masalah | Penyebab | Perbaikan |
|---|---|---|
| Prompt ditolak | Kata kunci wajah atau frasa ambigu | Hapus deskripsi wajah eksplisit; gunakan referensi @image |
| Frame hitam | Prompt terlalu kompleks | Potong menjadi satu aksi per 4–5 detik; turunkan resolusi untuk uji |
| Wajah karakter berubah antar shot | Tidak ada referensi konsisten | Sematkan @image1 yang sama di setiap shot timeline |
| Audio tidak sinkron | Mismatch joint diffusion | Regenerasi dengan audio dinonaktifkan, tambahkan bed secara terpisah |
| Distorsi tangan atau jari | Interaksi tangan kompleks tanpa referensi | Tambahkan gambar referensi pose tangan yang diinginkan |
| Tekstur "AI-generated" | Terlalu mengandalkan kata kunci gaya | Tambahkan detail fisik — material, pencahayaan, jenis lensa |
Seedance 2.0 vs Seedance 1.0
Jika Anda pernah memakai 1.0, jarak ke 2.0 lebih lebar daripada angka versi menunjukkan.
| Fitur | 1.0 | 2.0 |
|---|---|---|
| Arsitektur | Pipeline terpisah | Unified diffusion Transformer |
| Input gambar | 1 opsional | hingga 9, dapat ditarget via @tag |
| Input video | Tidak ada | hingga 3 |
| Input audio | Tidak ada | hingga 3 |
| Output audio native | Tidak | Ya |
| Resolusi maksimum | 1080p | 2K |
| Durasi | 5–10s | 4–15s |
| Multi-shot | Dasar | Timeline storyboard dengan konsistensi antar shot |
| Kualitas tangan | Artefak sering | Jelas lebih baik |
| In-video editing | Tidak | Ya — swap karakter / objek |
| Usable dari percobaan pertama | ~60% | 90%+ |
Kapan memilih alternatif lain
Seedance 2.0 bukan alat yang tepat untuk setiap brief.
| Kebutuhan | Pilihan lebih baik |
|---|---|
| 4K 60fps untuk siaran | Veo 3 |
| Arahan gerakan per frame | Runway Gen-4.5 |
| 720p sosial dengan audio termurah | Grok Imagine |
| Loop iterasi tercepat | HappyHorse 1.0 |
| Kontrol lensa terparameterisasi berat | V6 |
| Adegan single-take panjang | Sora 2 |
Harga di OmniArt
Seedance 2.0 dihargai dengan kredit di dalam workspace video OmniArt. Standard 720p berjalan 30 kredit per detik; Fast 720p 20 kredit per detik. Anggota Ultra mendapat diskon kredit 40% di kedua mode. Sebagai cek kasar pada matematika iterasi: klip Standard 720p 5 detik = 150 kredit, klip Fast 720p 5 detik = 100.
Warning
ByteDance belum menerbitkan hak penggunaan komersial eksplisit untuk output Seedance 2.0 per tulisan ini. Untuk pekerjaan komersial berisiko tinggi, periksa ulang ketentuan lisensi platform sebelum delivery.
Memulai di OmniArt
Seedance 2.0 berada di workspace video OmniArt bersama V6, BACH, Sora 2, Veo 3, Kling 3.0, HappyHorse 1.0, dan Grok Imagine. Saldo kredit sama, upload referensi sama, tata bahasa prompt sama.
Mulai dengan prompt adegan film sinematik di atas untuk merasakan alur multi-referensi, lalu pindah ke brief video musik setelah Anda ingin menguji konsistensi wajah dalam gerakan.
Jika Anda memilih antara Seedance 2.0 dan HappyHorse 1.0, perbandingan HappyHorse 1 vs Seedance 2 membahas trade-off shot demi shot. Untuk urutan naratif lebih panjang, panduan sinematografer BACH adalah titik awal yang lebih kuat.