industryModel dan insight8 menit baca

Gemini Omni Flash: apa yang diluncurkan dan apa yang ditahan Google

Google meluncurkan Gemini Omni Flash di I/O 2026 — inilah yang bisa dilakukan model Omni pertama, apa yang sengaja ditahan, dan langkah praktis bagi kreator di OmniArt.

Tim OmniArt
Gemini Omni Flash: apa yang diluncurkan dan apa yang ditahan Google

Google I/O 2026 berlangsung pada 19 Mei, dan begitu keynote selesai, Gemini Omni Flash sudah langsung tersedia. Bukan "segera hadir", bukan "pratinjau terbatas" — tersedia di hari yang sama. Dua minggu lalu kami menerbitkan analisis kebocoran informasi pra-I/O, memisahkan sinyal yang terkonfirmasi dari spekulasi. Sekarang kita punya model sungguhan. Berikut apa yang diluncurkan, apa yang sengaja tidak diluncurkan Google, dan apa artinya bagi kreator yang punya tenggat minggu ini.

Omni Flash adalah model publik pertama dalam framework "Omni" baru Google. Ini bukan Veo 4, dan bukan sekadar rebranding Veo 3.1 — ini adalah lini produk terpisah, dengan Omni Pro tingkat atas yang sudah dikonfirmasi oleh Google DeepMind sebagai kelanjutannya. Belum ada tanggal untuk Omni Pro. Flash adalah fase pertama.

Yang dikonfirmasi vs. yang ditahan

Artikel tentang kebocoran menyebut model ini "video native Gemini dengan ambisi omni-modal". Itu terbukti tepat. Berikut gambaran lengkapnya setelah hiruk pikuk keynote mereda.

FiturStatusArtinya bagi kreator
Klip video 10 detik dengan audio tersinkronisasi dari satu promptDiluncurkanKonten short-form untuk media sosial, trailer, dan ident adalah penggunaan alami untuk durasi klip ini
Input apa saja: teks, gambar, audio, dan video dalam satu promptDiluncurkanAnda bisa menyertakan gambar referensi, catatan suara, dan briefing sekaligus — satu tata bahasa prompt untuk ketiganya
Pengeditan percakapan ("ubah pencahayaannya", "ganti anjingnya dengan kucing")DiluncurkanPerubahan alur kerja yang disebut artikel kebocoran sebagai berita utama sesungguhnya — lebih lanjut di bawah
Tanda air SynthID di setiap outputDiluncurkan — tidak bisa dinonaktifkan, tanpa toggle di APIRencanakan bahwa output akan selalu bertanda air secara default; periksa ketentuan penggunaan sebelum penempatan komersial
Mengedit ucapan atau audio dalam video yang dihasilkanDitahan demi keamananRisiko terkait deepfake; Google telah mengkonfirmasi ini adalah penahanan yang disengaja, bukan keterbatasan teknis
Mode avatarDitahanKategori kekhawatiran yang sama dengan pengeditan audio — tidak ada jadwal yang diberikan
API untuk pengembang"Dalam beberapa minggu ke depan"Jangan membangun pipeline produksi sampai API tersedia dan stabil

Peringatan

Dua kemampuan penting — pengeditan audio dalam video dan mode avatar — sengaja ditahan saat peluncuran, bukan karena alasan teknis melainkan karena keamanan. Google telah mengkonfirmasi hal ini. Jika pipeline Anda bergantung pada salah satunya, tidak ada solusi alternatif dan tidak ada tanggal rilis.

Google juga secara publik mengakui tiga keterbatasan saat ini: konsistensi visual selama pengeditan, urutan gerakan kompleks, dan rendering teks yang dapat dibaca dalam video. Ini adalah kelemahan yang sama yang dimiliki seluruh kategori video AI; Omni Flash belum menyelesaikannya.

Kebocoran vs. kenyataan

Sebelum I/O, kami menguraikan tiga skenario tentang apa yang bisa menjadi Omni: rebranding Veo untuk konsumen, model video native Gemini, atau sistem omni-modal terpadu yang sesungguhnya. Kami menyebut "perpaduan skenario 2 dan 3" sebagai yang paling mungkin.

Itu akurat. Omni Flash jelas-jelas native Gemini — ia berjalan di dalam aplikasi Gemini dan Google Flow, bukan sebagai permukaan Veo yang berdiri sendiri — dan benar-benar menerima input apa saja. Framing "omni-modal" yang diberikan Google bukan berlebihan dari sisi pemasaran; menggabungkan teks, gambar, audio, dan video dalam satu prompt adalah perubahan kemampuan nyata dari model input Veo 3.1.

Yang tidak tepat dalam spekulasi: framing "remix" dari kebocoran meremehkan kedalaman fitur pengeditan percakapan. Ini bukan sekadar remix dari awal. Ia mempertahankan konsistensi di berbagai putaran pengeditan, yang secara material berbeda.

Pengeditan percakapan adalah berita utama sesungguhnya

Semua model video AI besar hari ini bekerja dengan cara yang sama di tingkat alur kerja: Anda menulis prompt, menunggu, mengunduh klip, dan menulis ulang prompt jika hasilnya salah. Omni Flash mengubah ini. Fitur pengeditan percakapan memungkinkan Anda mengetik "ubah pencahayaan menjadi golden hour" atau "ganti anjing dengan kucing" dan mendapatkan klip yang direvisi yang mempertahankan konsistensi dengan output sebelumnya alih-alih menghasilkan dari awal.

Ini penting karena biaya iterasi dalam video selalu berada di siklus regenerasi — baik dalam waktu maupun kredit. Pengeditan multi-giliran yang mempertahankan konsistensi mempersempit jarak antara draf pertama dan klip yang selesai. Ini juga berarti model menyimpan status tentang proyek Anda dengan cara yang tidak bisa dilakukan oleh alur kerja generate-and-discard.

Keterbatasan yang diakui saat ini nyata: urutan gerakan kompleks kehilangan koherensi selama pengeditan, dan model masih bisa menyimpang pada detail visual yang halus. Namun prinsip alur kerjanya kuat, dan ini adalah fitur yang paling mungkin bertahan dengan baik seiring model dasarnya berkembang.

Di mana Omni Flash berada dalam jajaran produk

Keunggulan Omni Flash adalah aksesibilitas konsumen, iterasi percakapan, dan fleksibilitas input multi-modal. Keterbatasannya — klip 10 detik, tanpa pengeditan ucapan, kesenjangan gerakan dan rendering teks yang diakui — mendefinisikan jalurnya dengan jelas.

Gambar membutuhkanGunakan
Iterasi percakapan, penyempurnaan berbasis chatOmni Flash (di platform Google)
4K native, audio spasial, kualitas siaranVeo 3.1
Pengambilan gambar tunggal yang panjangSora 2
Kontinuitas storyboard multi-shotKling, V6 + BACH
Klip cepat, bergaya, berenergi tinggiModel-model PixVerse
Efisiensi biaya dalam volumeKling (detik yang selesai dengan biaya efisien)

Untuk analisis lebih mendalam yang membandingkan Omni Flash dan Veo 3.1 shot demi shot, lihat Gemini Omni Flash vs. Veo 3.1: mana yang cocok untuk alur kerja Anda.

Di mana sebenarnya mengaksesnya

Omni Flash tersedia di YouTube Shorts, YouTube Create, aplikasi Gemini, dan Google Flow. Penetapan harga melalui tingkat langganan AI Google: AI Plus mulai sekitar $7,99/bulan, dan Ultra turun dari $250 menjadi $100/bulan. API pengembang akan hadir "dalam beberapa minggu ke depan" — tanpa tanggal pasti.

Untuk konteks tentang lini Veo secara keseluruhan, status rilis Veo 4 dan di mana Veo berada di OmniArt mencakup apa yang sudah bisa dilakukan Veo 3.1 dan posisinya di dalam workspace multi-model.

Omni Pro sudah dikonfirmasi — tapi belum dijadwalkan

Google DeepMind telah mengkonfirmasi Omni Pro tingkat atas akan hadir, dideskripsikan sebagai "satu langkah di atas Flash". Tidak ada tanggal rilis, tidak ada daftar fitur, dan tidak ada akses pratinjau. Rencanakan berdasarkan apa yang diluncurkan, bukan apa yang dijanjikan.

Jika pipeline Anda memiliki deliverable Q3, bangun berdasarkan spesifikasi Omni Flash yang terkonfirmasi hari ini. Ketika Omni Pro tiba, Anda menambahkannya sebagai pilihan dalam alur kerja yang sudah berproduksi — Anda tidak menunggunya, dan Anda tidak membangun ulang platform karenanya.

Catatan

Inilah argumen untuk workspace multi-model dalam praktik: rilis baru adalah tambahan, bukan gangguan. Anda membandingkannya dengan apa yang sudah Anda kirimkan, bukan apa yang Anda tunggu-tunggu.

Apa yang harus dilakukan minggu ini

Omni Flash berjalan di platform milik Google sendiri — aplikasi Gemini, YouTube Shorts, Google Flow. Jika Anda ingin menguji pengeditan percakapan, itulah tempatnya. Google belum mengumumkan integrasi API pihak ketiga di luar jadwal pengembang "beberapa minggu ke depan".

Di OmniArt, Anda bekerja hari ini dengan Veo 3.1 untuk 4K native dan audio spasial, serta sisa jajaran produk — model-model PixVerse, Sora 2, Kling, HappyHorse, Seedance 2, dan lebih banyak lagi — untuk gambar, video, audio, dan musik dalam satu workspace. Satu saldo, satu tata bahasa prompt, satu tempat untuk membandingkan output secara berdampingan.

Untuk langkah-langkah praktis memaksimalkan Veo 3.1 saat Anda mengevaluasi Omni Flash, panduan prompt dan sinematografi Veo 3.1 mencakup seluruh alur kerja dari briefing hingga klip yang selesai.

Langkah praktis: jalankan briefing Anda saat ini melalui model yang sudah tersedia dan stabil. Ketika Omni Pro tiba — atau ketika API Omni Flash terbuka — Anda menambahkannya ke pipeline yang sudah berproduksi, bukan menunggu untuk mulai.

Pertanyaan yang sering diajukan

Apakah Gemini Omni Flash tersedia sekarang?

Ya. Diluncurkan di Google I/O 2026 pada 19 Mei 2026, dan tersedia di hari yang sama melalui YouTube Shorts, YouTube Create, aplikasi Gemini, dan Google Flow. API pengembang dideskripsikan akan hadir "dalam beberapa minggu ke depan".

Apa perbedaan antara Omni Flash dan Veo 3.1?

Omni Flash adalah native Gemini, menerima input apa saja (teks, gambar, audio, video dalam satu prompt), dan memiliki pengeditan percakapan multi-giliran. Veo 3.1 adalah model video khusus dengan output 4K native yang dikonfirmasi dan audio spasial. Keduanya memiliki keunggulan berbeda dan saat ini berada di platform yang berbeda.

Fitur apa yang ditahan Google dari Omni Flash?

Dua kemampuan sengaja ditahan: pengeditan ucapan dan audio dalam video, serta mode avatar. Google telah mengkonfirmasi bahwa ini ditahan karena alasan keamanan, bukan keterbatasan teknis. Tidak ada tanggal rilis untuk keduanya.

Apakah Gemini Omni Pro akan menggantikan Flash?

Google DeepMind telah mengkonfirmasi Omni Pro sebagai model tingkat lebih tinggi di masa depan yang dideskripsikan sebagai "satu langkah di atas Flash", tetapi tidak ada fitur, penetapan harga, atau tanggal rilis yang diungkapkan. Rencanakan berdasarkan kemampuan Flash yang terkonfirmasi; perlakukan Omni Pro sebagai tambahan masa depan.

Apakah Omni Flash memiliki tanda air SynthID?

Ya. Setiap output Omni Flash menyertakan tanda air SynthID. Tidak bisa dinonaktifkan dan tidak memiliki toggle API. Periksa ketentuan layanan platform sebelum menggunakan output dalam konteks komersial.

Siap membuat?

Mulai hasilkan konten menakjubkan dengan AI

Mulai gratis