guideTutorial dan panduan cara7 menit baca

Cara menulis prompt Gemini Omni Flash untuk video 10 detik

Gemini Omni Flash punya permukaan prompt yang tidak biasa: tanpa parameter negatif, dua rasio aspek, hanya bahasa Inggris, dan dua mode prompt berbeda. Berikut cara menulis keduanya dengan baik.

Tim OmniArt
Cara menulis prompt Gemini Omni Flash untuk video 10 detik

Kebanyakan panduan prompt video AI mengajari Anda menulis satu hal: sebuah paragraf yang kaya dan rinci yang Anda serahkan ke model sekali saja. Gemini Omni Flash mematahkan asumsi itu. API developer-nya (aktif sejak 30 Juni) dibangun di sekitar dua tindakan prompt yang berbeda — generasi pertama, lalu percakapan berjalan berisi pengeditan yang masing-masing membentuk ulang klip yang sama. Menulis untuk salah satunya dan mengabaikan yang lain berarti Anda menyisakan sebagian besar kemampuan model tanpa dipakai.

Permukaan prompt Omni Flash juga tidak biasa dalam hal apa yang dihilangkannya. Tidak ada kolom prompt negatif, tidak ada tuas temperature, tidak ada system instruction, dan hanya dua rasio aspek. Itu bukan celah yang harus diakali secara buta — masing-masing mengubah cara Anda seharusnya menyusun sebuah prompt. Panduan ini mencakup kedua mode dan kendala-kendala yang membentuknya.

Catatan

Per 1 Juli 2026, Gemini Omni Flash tersedia melalui Google AI Studio, Gemini API, aplikasi Gemini, dan Google Flow — belum di dalam workspace OmniArt. Bagian-bagian di bawah menjelaskan cara menulis prompt langsung di alat milik Google sendiri; bagian penutup memetakan kebiasaan mana yang bisa dibawa ke model video yang sudah aktif di OmniArt hari ini.

Dua mode prompt, bukan satu

Setiap sesi Omni Flash punya dua jenis prompt, dan keduanya menghargai gaya penulisan yang berbeda.

Prompt generasi pertama adalah brief lengkap untuk satu momen 10 detik: subjek, gerak, kamera, cahaya, suara, gaya. Ia berperilaku seperti prompt teks ke video atau gambar ke video yang kuat pada umumnya — muat detail di depan, spesifik, deskripsikan seluruh shot sekaligus.

Instruksi pengeditan percakapan justru kebalikannya. Ia singkat, menyebut tepat satu perubahan, dan mengasumsikan model sudah menyimpan klip sebelumnya dalam konteks. "Buat pencahayaannya golden hour." "Ganti sedan dengan pikap." Model menerapkan perubahan itu sambil mempertahankan segala hal yang tidak Anda sebutkan — lewat previous_interaction_id yang membawa status sesi hingga tiga pengeditan berurutan melalui Interactions API. Menumpuk tiga perubahan dalam satu instruksi pengeditan berarti Anda kehilangan presisi yang membuat mode ini layak dipakai.

Model mentalnya: susun di prompt pertama, arahkan di tindak lanjutnya. Dapatkan klip dasar yang solid, lalu perhalus seperti Anda memberi arahan pada seorang sutradara di tengah pengambilan gambar — satu catatan pada satu waktu.

Kendala API yang membentuk penyusunan kata Anda

Daftar parameter Omni Flash sengaja dibuat pendek. Setiap yang dihilangkan punya konsekuensi pada prompt:

KendalaApa artinya bagi prompt
Tanpa kolom prompt negatifSusun pengecualian di dalam prompt itu sendiri — "jalanan kosong, tanpa pejalan kaki, tanpa lalu lintas" alih-alih daftar negatif terpisah
Tanpa temperature / top_p / system instructionAnda tidak bisa mengatur variasi atau menetapkan aturan gaya permanen — tanamkan nada dan gaya ke dalam teks prompt setiap kali
Rasio aspek: hanya 9:16 atau 16:9Pilih orientasi sejak awal; tidak ada opsi persegi atau lebar sinematik, jadi susun bingkai untuk vertikal atau horizontal sejak kata pertama
Audio dideskripsikan, tidak pernah diunggahAnda tidak bisa menyerahkan trek untuk dicocokkan — Anda mendeskripsikan suara yang diinginkan dalam kata-kata (lihat di bawah)
Bahasa Inggris didukung penuh; bahasa lain belum diujiTulis prompt dalam bahasa Inggris untuk hasil yang dapat diprediksi
Batas keras 10 detikSatu aksi yang jelas per generasi — bukan daftar shot

Peringatan

Omni Flash tidak punya unggahan referensi audio. Anda tidak bisa memberinya bed musik atau sampel suara untuk disinkronkan. Ia menghasilkan trek audio secara default, dan satu-satunya kendali Anda adalah kata-kata dalam prompt — jadi desain suara harus ditulis, bukan dilampirkan.

Sebuah template untuk generasi pertama

Karena 10 detik hanya memuat satu momen, prompt pertama yang paling kuat mendeskripsikan satu momen berkelanjutan dengan setiap lapisan yang ditentukan. Enam slot mencakup hampir semua shot:

  1. Subjek — siapa atau apa yang ada di layar, dideskripsikan secara konkret
  2. Gerak — satu aksi yang berlangsung sepanjang klip
  3. Kamera — satu gerakan, bukan rangkaian ("push in lambat", "wide terkunci")
  4. Pencahayaan — arah, kualitas, waktu dalam sehari
  5. Desain suara — audio yang ingin Anda hasilkan, dalam kata-kata
  6. Gaya — palet, era, referensi film, tekstur

Sebuah contoh yang sudah diolah:

"Sebuah dripper kopi pour-over keramik di atas meja kayu ek pucat, uap mengepul saat kopi gelap mengalir ke dalam labu kaca di bawahnya. Push in lambat pada tetesan. Cahaya pagi lembut dari jendela di kiri kamera, hangat dan menyebar. Suara: gemericik air lembut, ambience dapur di kejauhan, tanpa musik. Palet editorial yang teredam, kedalaman bidang dangkal, diambil dengan lensa prime cepat."

Perhatikan pengecualian tinggal di dalam kalimat ("tanpa musik"), kamera hanya satu gerakan, dan suara dijabarkan. Itulah keseluruhan disiplinnya.

Pengeditan percakapan: kosakata yang mengena

Setelah Anda punya klip dasar, pengeditan adalah tempat Omni Flash unggul dari workflow hasilkan-lalu-buang. Jaga setiap instruksi pada satu maksud, dan andalkan kosakata kata kerja yang konsisten agar model membacanya dengan bersih:

  • Relight — "buat golden hour", "tambahkan rim light dingin dari belakang"
  • Ganti — "tukar dripper kopi dengan French press"
  • Ubah gaya — "buat terasa seperti film stock tahun 1970-an"
  • Ubah warna — "ubah mug menjadi hitam matte"
  • Ubah tempo — "perlambat tuangan", "biarkan uap bertahan lebih lama"

Dua aturan menjaga thread tetap koheren. Satu perubahan per giliran — model mempertahankan apa yang tidak Anda sebutkan, jadi pengeditan satu catatan lebih dapat diprediksi sekaligus lebih mudah dibatalkan dengan prompt ulang. Dan bangun di atas bahasa giliran sebelumnya — pakai lagi kata benda yang sudah Anda tetapkan ("mug itu", "tuangan itu") agar model berpegang pada elemen yang sama alih-alih menyimpulkan ulang adegan.

Tips

Rantai tiga pengeditan adalah anggaran, bukan saran. Rencanakan prompt dasar agar butuh tindak lanjut sesedikit mungkin — generasi pertama yang kuat menyisakan giliran pengeditan Anda untuk perubahan kreatif sejati, bukan untuk membetulkan hal yang seharusnya bisa ditentukan prompt pertama.

Mengakali batasan saat ini

Beberapa batasan tidak bisa dipecahkan lewat prompt, dan lebih baik menulis prompt dengan mengingatnya alih-alih melawannya:

  • Batas 10 detik. Tidak ada perpanjangan adegan di API, jadi jangan menulis prompt yang menyiratkan alur lebih panjang. Rancang satu momen yang berdiri sendiri.
  • Konsistensi karakter di antara pergantian adegan adalah titik lemah yang diakui. Jika kemiripan penting, jaga pengeditan tetap dalam adegan yang sama alih-alih meminta model memindahkan karakter ke latar baru.
  • Referensi video di atas 3 detik tidak diproses sepenuhnya. Jaga setiap klip referensi tetap singkat dan langsung ke intinya.
  • Tanpa referensi multi-video dan tanpa pengeditan suara — keduanya tidak didukung, jadi rencanakan langkah-langkah itu di alat terpisah, bukan di prompt.

Tidak satu pun dari ini yang mendiskualifikasi alat iterasi cepat berformat pendek. Semuanya hanya berarti Omni Flash menghargai prompt yang dibatasi pada apa yang dilakukannya dengan baik: satu momen ringkas, diperhalus secara percakapan.

Apa yang bisa dibawa ke OmniArt hari ini

Omni Flash belum ada di workspace OmniArt, tetapi hampir setiap kebiasaan di atas bisa dibawa ke model video yang sudah ada — karena disiplin dasarnya (satu momen yang jelas, spesifisitas ketimbang tumpukan kata kunci, suara yang ditulis ke dalam prompt) tidak bergantung pada model.

  • Generasi berbasis referensi memetakan langsung ke Seedance 2.0, yang sudah aktif di OmniArt, yang menerima hingga sembilan gambar, tiga video, dan tiga file audio yang terikat ke peran dengan sintaks @image1 / @video1 — gagasan "susun dari aset", dengan lebih banyak input dibanding yang ditawarkan Omni Flash.
  • Bahasa kamera sinematik memetakan ke Veo 3.1, yang menafsirkan kata kerja gerak seperti "drift", "glide", dan "dolly in" dengan pengendalian.
  • Template enam slot (subjek, gerak, kamera, cahaya, suara, gaya) adalah kerangka yang sama yang menghasilkan hasil bersih pada setiap model video di workspace.

Buka workspace video di OmniArt, pilih model yang cocok dengan shot, dan tulis prompt pertama sebagai satu momen lengkap. Ketika Omni Flash hadir, workflow dua mode di atas adalah bagian yang akan Anda tambahkan — keahlian menulis prompt-nya sudah sama.

Siap membuat?

Mulai hasilkan konten menakjubkan dengan AI

Mulai gratis