guideModel dan insight6 min read
Journal · Model dan insight

Grok Imagine: panduan kreator untuk model video xAI di 2026

Panduan praktis Grok Imagine — enam mode generasi, pola prompt, matematika biaya nyata, dan kapan memilihnya daripada V6 atau Sora 2 di 2026.

Tim OmniArt·
Grok Imagine: panduan kreator untuk model video xAI di 2026

Grok Imagine adalah model generasi video dan audio xAI, diluncurkan Januari 2026 dan dapat diakses melalui OmniArt tanpa langganan xAI terpisah. Produk berbeda dari chatbot Grok — mereka berbagi nama dan tidak lebih. Panduan ini mencakup kegunaan Grok Imagine, enam mode generasi yang penting, pola prompt yang menghormati masing-masing mode, dan matematika biaya proyek nyata dalam kredit.

Apa itu Grok Imagine

Grok Imagine menghasilkan video hingga 720p dengan audio native dalam klip 1–15 detik. Trik headline bukan resolusi — di 720p model sengaja tidak bersaing Sora 2 atau V6 pada fidelitas mentah. Trik headline adalah permukaan alur kerja di sekitar model: enam mode generasi yang berbagi satu weight set dan memungkinkan Anda generate, extend, restyle, dan modify tanpa meninggalkan model.

SpesifikasiNilai
Resolusi maksimum720p (gunakan V6 untuk 1080p+)
Durasi maksimum15 detik per generasi
Rasio aspek16:9, 4:3, 1:1, 9:16, 3:4, 3:2, 2:3
AudioNative, dihasilkan bersama video
Biaya (480p)10 kredit per detik
Biaya (720p)15 kredit per detik

Enam mode yang perlu Anda ketahui

Setiap mode adalah cara berbeda memberitahu model jenis input yang sedang dikerjakan. Memilih mode yang tepat adalah sebagian besar pekerjaan prompt engineering.

Text-to-Video

Default. Tulis prompt, dapatkan klip. Terbaik untuk eksplorasi konsep, mood board, dan draft sosial saat Anda belum punya gambar referensi. Biaya 10–15 kredit per detik tergantung resolusi.

Image-to-Video

Menganimasi still sambil mempertahankan komposisi input. Frame pertama dikunci ke gambar Anda. Gunakan untuk menganimasi ilustrasi, fotografi produk, dan mockup desain di mana frame sumber non-negotiable.

Reference Mode — pembeda

Reference Mode menerima 1–7 gambar sebagai jangkar visual tanpa mengunci frame pertama. Anda tag gambar dengan @Image1, @Image2, @Image3 dan referensikan di prompt. Ini yang kebanyakan model video lain tidak punya — kebanyakan either mengunci frame pertama (image-to-video) atau tidak menerima referensi sama sekali (text-to-video). Reference Mode di tengah, dan jalur paling bersih ke konsistensi karakter across banyak shot.

Biaya 15 kredit per detik di 480p, 22,5 di 720p.

Extend Mode

Menambahkan 2–10 detik ke klip existing. Input MP4 antara 2 dan 15 detik. Output satu klip kontinu; billing hanya mencakup bagian yang ditambahkan. Trik cross-model: Extend Mode bekerja pada video yang dihasilkan model manapun di workspace video OmniArt, bukan hanya Grok.

Modify Mode

Mengedit klip existing tanpa regenerasi — swap background, perubahan pencahayaan, shift warna pada objek spesifik, efek cuaca. Input dibatasi 8 detik dan auto-scale ke 854×480, artinya sumber high-resolution kehilangan detail dalam round trip. Gunakan Modify pada klip yang Anda generate di 480p anyway.

Editing Suite — Restyle, Object Manipulation, Sketches to Life

Rangkaian operasi pasca-generasi. Restyle menerapkan gaya artistik (Cyberpunk, Anime, Retro, Origami, Watercolor, Mosaic). Object Manipulation menambah, menghapus, atau swap elemen. Sketches to Life menganimasi line drawing. Add Performance menempel animasi karakter pada figur statis. Berguna membuat banyak variasi dari satu klip sumber.

Prompt yang menghormati model

Empat kebiasaan mengangkat kualitas lebih cepat daripada prompt lebih panjang.

Gunakan bahasa sinematik

Grok Imagine punya enam preset kamera built-in: Zoom In, Zoom Out, Dolly Out, Tilt Up, Pan Right, Timelapse. Mereka aktif lebih presisi saat prompt memakai istilah sinematografi.

Lebih lemahLebih kuat
"A city street at night with neon signs and people walking""Dolly forward through a rain-slicked Tokyo alley, neon signs reflecting in puddles, shallow depth of field, a figure with an umbrella enters frame right, cinematic 2.39:1 framing"

Tag referensi eksplisit

Reference Mode degrade saat prompt generik. Bind setiap referensi ke peran.

"@Image1 (the red sports car) drifts around a mountain corner with @Image3 (the sunset sky) in the background while @Image2 (the driver character) grips the steering wheel."

Muat aksi di depan

Generasi berjalan sequential sepanjang durasi. Jika klimaks di akhir klip 5 detik, model mungkin tidak menyelesaikannya. Pindahkan aksi ke depan.

Lebih lemahLebih kuat
"A quiet forest scene with birds, then suddenly a deer leaps across a stream""A deer leaps across a forest stream in golden hour light, camera tracking its arc, birds scatter from nearby branches"

Pace klip 10–15 detik pada timeline

Untuk klip lebih panjang, tulis timing ke prompt.

"Slow zoom into abandoned library (0–5s), dust particles catch light beams (5–10s), book falls from shelf (10–12s), pages flutter (12–15s)."

Berapa biaya sebenarnya

Tiga skenario shot nyata, dihargai dalam kredit OmniArt.

Video produk TikTok 15 detik

LangkahModeResolusiBiaya
Generasi awalText-to-Video480p, 10s100
ExtendExtend480p, 5s75
Total (satu revisi)175–275

Storyboard brand 3 shot

LangkahModeResolusiBiaya
Shot 1 dengan 2 refReference, 8s720p180
Shot 2, ref samaReference, 8s720p180
Shot 3, ref samaReference, 6s720p135
Perbaikan pencahayaan Shot 2Modify, 8s720p180
Total675

Pass restyle

LangkahModeResolusiBiaya
Restyle ke AnimeRestyle, 8s480p120

Kapan memilih model berbeda

Grok Imagine alat tepat untuk sosial short-form, pekerjaan sketch-to-life, dan cerita multi-shot berbasis referensi di 480p–720p. Alat salah saat:

KebutuhanPilihan lebih baik
1080p atau lebih tinggiV6, BACH, Veo 3
Kontrol lensa lanjutan (focal length, DOF, aberration)V6
Klip 16–20 detik dalam satu passSora 2
Dialog dan musik production-gradeModel audio dedicated + edit
Preservasi sumber high-resolution dalam editHindari Modify Mode

Pola alur kerja yang ship

Cara Grok Imagine membuahkan hasil di OmniArt bukan sebagai generator standalone — melainkan sebagai lapisan iterasi. Dua pola paling menguntungkan.

Pola 1 — generate di tempat lain, refine di sini. Render master clip dengan V6 atau Sora 2 di resolusi lebih tinggi, lalu gunakan Extend, Restyle, dan Modify untuk spin variasi dan penambahan di Grok dengan biaya lebih rendah.

Pola 2 — Reference Mode untuk character lock. Saat kampanye brand butuh karakter sama di lima shot, kunci identitas dengan satu gambar anchor di @Image1, lalu generate setiap shot dengan referensi sama di Reference Mode. Lebih murah daripada re-roll Sora 2 untuk setiap shot.

Warning

Modify Mode auto-scale input di atas 854×480 turun ke 480p sebelum processing. Jika Anda perlu edit klip 1080p tanpa kehilangan resolusi, render edit di tempat lain atau lakukan edit sebelum langkah upscale.

Memulai di OmniArt

Grok Imagine tersedia di workspace video OmniArt bersama V6, BACH, Sora 2, Veo 3, Kling 3.0, HappyHorse 1.0, dan Seedance 2.0. Saldo kredit sama, upload referensi sama, tata bahasa prompt sama. Mulai di Text-to-Video untuk mempelajari preset kamera, lalu naik ke Reference Mode setelah Anda punya karakter atau produk untuk dikunci.

Pasangkan panduan ini dengan breakdown sinematografer BACH untuk pekerjaan naratif higher-fidelity, atau shortlist image-to-video terbaik jika Anda memilih model untuk shot spesifik.

Start creating

Siap membuat?

Mulai hasilkan konten menakjubkan dengan AI