Gemini Omni leak: โมเดลวิดีโอ Google อาจหมายความว่าอะไร
ก่อน Google I/O 2026 leak ชี้โมเดลวิดีโอ Gemini Omni สิ่งที่ยืนยัน สิ่งที่ยังเป็น rumor และครีเอเตอร์ OmniArt ควรทำอะไรสัปดาห์นี้

Google I/O 2026 อยู่ 19–20 พ.ค. และมุมวิดีโอ AI ของอินเทอร์เน็ตกำลัง «pre-live» keynote แล้ว เหตุผลคือ UI string เดียวในแท็บวิดีโอ Gemini: «Start with an idea or try a template. Powered by Omni.» จากบรรทัดเดียว leak สามคลื่นสร้างภาพโมเดลวิดีโอ Google ที่ยังไม่ประกาศ — ชั่วคราวเรียก Gemini Omni — ที่อาจแทน Veo 3.1 อยู่ข้างๆ หรือ upgrade stack generative ของ Google เงียบๆ
บทความนี้อ่านสำหรับครีเอเตอร์ OmniArt ที่ตัดสินใจว่าจะทำอะไรก่อนวันอังคาร แยกสัญญาณที่ยืนยันกับการ speculate เดินผ่านสาม identity ที่เป็นไปได้ของ Omni และปิดด้วยทางปฏิบัติสำหรับครีเอเตอร์ที่ต้องส่งวิดีโอสัปดาห์นี้
สิ่งที่เรารู้จริง (และไม่รู้)
| สัญญาณ | สถานะ | ความหมาย |
|---|---|---|
| UI string «Powered by Omni» ในแท็บวิดีโอ Gemini | ยืนยันใน screenshot | ผลิตภัณฑ์ชื่อ Omni stage ไว้ release หลัง feature flag |
Model ID bard_eac_video_generation_omni | รายงานผ่าน app inspection | identifier ภายใน plumbed ผ่าน pipeline วิดีโอ Gemini |
| จำกัดคลิป 10 วินาที | รายงานจาก early tester | ชี้ early-stage หรือ consumer-tier ไม่ใช่ API tier |
| «Remix your videos, edit directly in chat, try a template» | copy feature ที่รายงาน | workflow edit-and-remix ไม่ใช่ generate-only |
| text coherence แข็ง (เช่น สมการคณิตศาสตร์) | รายงานใน demo coverage | ก้าวทางเทคนิคที่ notable สำหรับ typography ในวิดีโอ |
| เสียง native | ยังไม่ยืนยัน | Veo 3.1 ship เสียง native สถานะ Omni ไม่ชัด |
| API access | ยังไม่ยืนยัน | developer ไม่ควรวางแผนบน availability ที่ยังไม่ยืนยัน |
| แทน เสริม หรือ rebrand Veo 3.1 | คำถามเปิด | คำถามสำคัญที่สุดสำหรับทีม production |
สรุปซื่อสัตย์: ผลิตภัณฑ์วิดีโอ Google ชื่อ Omni จริงพอ ship UI copy แต่ทุก architectural claim ยังเป็น inference จาก app string และรายงาน tester
สาม identity ที่เป็นไปได้
ความไม่แน่นอนส่วนใหญ่ยุบเป็นสาม scenario ว่า Omni คืออะไร แต่ละแบบ implication ต่อ lineup เครื่องมือวิดีโอ AI ที่ครีเอเตอร์พึ่งพา
Scenario 1 — Consumer rebrand ของ Veo
การอ่านง่ายสุด: Omni แทน branding «Veo» บนพื้นผิว consumer ใน Gemini คล้าย Google รวม image generation หลัง «Nano Banana» Veo ยังเป็น engine ด้านล่าง Omni คือ surface ที่ผู้ใช้ส่วนใหญ่เห็น
ถ้าจริง คาด: เปลี่ยน capability น้อยเทียบ Veo 3.1 limit 8–10 วินาที tier consumer เดิม และ Veo ต่อบน enterprise/API track
Scenario 2 — โมเดลวิดีโอ Gemini-native
การอ่านที่สอง: Omni เป็นเวอร์ชัน architecture Gemini fine-tune เฉพาะวิดีโอ วิ่งคู่ขนาน Veo track Veo ยังเป็น dedicated video model สำหรับ API และ enterprise Omni เป็น consumer model ที่ได้ประโยชน์จาก text และ reasoning ของ Gemini
ถ้าจริง คาด: prompt adherence แข็งขึ้น typography ในวิดีโอ ดีขึ้น (รายงานสมการคณิตศาสตร์ support) และ integration แน่นขึ้นกับ chat-based editing
Scenario 3 — โมเดล omni-modal จริง
การอ่านทะเยอทที่สุด: Omni เป็นระบบรวมเดียว generate text ภาพ วิดีโอ และเสียง native จากโมเดลเดียว ชื่อ «Omni» ชี้ scenario ที่ Google positioning แม้ launch อาจไม่ถึง parity เต็ม
ถ้าจริง คาด: workflow shift ไป conversational editing handoff multi-modal ใน chat และความท้าทายระยะยาวต่อ stack model-per-modality ที่เหลือของสนาม
ผลที่น่าจะเป็นมากที่สุดที่ I/O คือ blend scenario 2 และ 3 — โมเดลวิดีโอ Gemini-native พร้อม ambition omni-modal แต่ limit consumer-tier ตอน launch
ทำไม feature ที่รายงานสำคัญ
สาม feature ที่รายงานควรได้ความสนใจมากกว่าคำถาม identity โมเดล เพราะสัญญาณทิศทางหมวดวิดีโอ AI ไม่ว่าใคร ship ก่อน
Conversational editing เป็น default
«Remix your videos, edit directly in chat» คือส่วน leak ที่เปลี่ยนบทสนทนา workflow เครื่องมือวิดีโอ AI วันนี้ยัง generate-and-download — prompt รอ save แล้ว re-prompt แก้ chat-based editing reframes โมเดลเป็น collaborator ต่อเนื่อง: «ทำช็อตสองอุ่นขึ้น» «สลับพื้นหลัง» «ต่อสามวินาที» ถ้า Omni ship สิ่งนี้ได้ดี มันกดดันทุกโมเดลให้ตาม
Templates เป็นทางเข้า
Templates ลด barrier prompt engineering สำหรับผู้ใช้ใหม่ — ประโยชน์จริง แต่ flatten diversity output เมื่อทุกคนเริ่มจาก prompt ชุดเดียว คำถามน่าสนใจไม่ใช่ templates ship หรือไม่ แต่ outperform brief เขียนดีจากศูนย์หรือไม่
ข้อความในวิดีโอ
รายงานสมการคณิตศาสตร์ render สะอาดในวิดีโอ generate เป็นเรื่องเทคนิค notable typography ในวิดีโอ เป็นจุดอ่อนที่เห็นชัดของโมเดลใหญ่ทุกตัว ถ้า Omni จัดการ typography ซับซ้อนได้ reliable เปิด workflow explainer การศึกษา และ motion graphics ที่ก่อนหน้านี้ต้อง compositing pass
Omni จะอยู่ตรงไหนใน lineup
สำหรับครีเอเตอร์ที่ทำงานข้าม video model หลายตัว คำถาม relevant คือ Omni fit ตรงไหน ไม่ใช่ชนะหรือไม่ รูปคำตอbaจาก feature ที่รายงาน:
| ความสามารถ | Gemini Omni (รายงาน) | Veo 3.1 (ยืนยัน) | V6 / R1 | Sora 2 |
|---|---|---|---|---|
| ความยาว | 10s (รายงาน) | สูงสุด 8s | 1–15s | สูงสุด 20s |
| ความละเอียด | ไม่ทราบ | สูงสุด 1080p | สูงสุด 1080p | 1080p, 4K มี |
| เสียง native | ยังไม่ยืนยัน | ยืนยัน | รวม | รวม |
| Editing / remix | รายงาน: remix, chat, templates | จำกัด | Modify, Extend, multi-clip | จำกัด |
| API access | ยังไม่ยืนยัน | มี | มี | มี |
| แข็งที่สุด | Conversational editing (รายงาน) | 4K native, spatial audio | cinematic control, real-time | ช็อตยาวเดียว |
ถ้า feature set ที่ leak hold lane ของ Omni คือ «conversational consumer video» — sweet spot งานโซเชียลเร็วและ iteration ขับด้วย chat lane cinematic broadcast และ multi-shot ยังอยู่กับ leader ปัจจุบันจนกว่ามีหลักฐานอื่น
ความหมายกับครีเอเตอร์สัปดาห์นี้
แรงดึงก่อนประกาศคือรอ เราขัดแย้งสำหรับใครมี deliverable สิบวันข้างหน้า
Warning
ถือทุก feature Omni ในสื่อเป็นสัญญาณก่อนประกาศ ไม่ใช่ความสามารถยืนยัน แผนจากสเปกที่รายงานรอด keynote ประมาณครึ่งหนึ่ง
ทางปฏิบัติขึ้นกับสิ่งที่กำลังส่ง
ถ้ามีวิดีโอครบกำหนดสัปดาห์นี้
ใช้สิ่งที่ live และพิสูจน์แล้ว V6 สำหรับช็อต cinematic Veo 3.1 สำหรับ cut broadcast 4K native Kling 3.0 สำหรับ variant โซเชียลหลายภาษา HappyHorse 1.0 สำหรับ iteration เร็ว ใน OmniArt ทั้งหมดคลิกเดียว ไม่ต้อง commit เครื่องมือเดียวก่อน keynote
ถ้าวางแผนผลิต Q3
สร้าง brief รอบความสามารถ ไม่ใช่แบรนด์ บันทึกสิ่งที่ต้องการจริง — ความยาว ความละเอียด เสียง editing model character lock — แล้วให้ lineup หลัง I/O bid งานใหม่สองสัปดาห์ ถ้า Omni ship และส่ง บรีฟเสียบได้โดยไม่เขียน pipeline ใหม่
ถ้ากำลัง research และเรียนรู้
ดู keynote เก็บ test ไม่ใช่ opinion สิ่งมีค่าที่สุดหลัง launch คือ comparison แอปเปิลต่อแอปเปิล — brief เดียว reference เดียว rubric เดียว — ข้ามสิ่งที่ ship Veo 3.1 และ lineup ที่มีอยู่
การเปลี่ยนแปลงใหญ่ที่ Omni ส่งสัญญาณ
ไม่ว่า Omni จะเป็นอะไร leak เล่าเรื่องหมวดชัดกว่าเรื่อง Google โดยเฉพาะ
พื้นผิวแข่งขันกำลังขยับ คุณภาพ visual รอบแรก converge กันในผู้นำ differentiation จริง shift ไป controllability multi-shot consistency audio-visual sync conversational editing และโมเดล fit workflow จริง — ไม่ใช่โมเดลไหนชนะ benchmark
ต้นทุนยังจริง รายงานซ้ำเรื่อง usage limit และ consumption tab ใน UI Omni ยืนยันว่า video generation fidelity สูงยัง expensive ต่อ scale templates และ clip cap สั้นเป็น UX และ economics
สิทธิ์และ remix ยากขึ้น workflow remix บนวิดีโอ generate เปิดคำถาม IP consent และ commercial use ที่ text-to-video ไม่ surface เต็มที่ ทีมใส่ output remix ใน paid media ควรมี rights checklist พร้อมก่อน feature ship
OmniArt จะจัดการอย่างไร
workspace OmniArt เพิ่มโมเดลเมื่อผ่านสองเกณฑ์: availability สาธารณะเสถียร และงานสร้างสรรค์จริงที่ lineup เดิมยังไม่ครอบคลุม Gemini Omni ถ้าและเมื่อลง จะประเมินทั้งสอง
ถ้า Omni ship ที่ I/O และผ่านเกณฑ์ คาดว่าอยู่ workspace ข้าง Veo 3.1, Sora 2, V6, Kling 3.0, HappyHorse 1.0, Seedance 2.0, Runway Gen-4.5, Hailuo และ Grok Imagine — grammar prompt เดียว ยอดเดียว ที่เดียวเปรียบเทียบกับที่เหลือ
สำหรับพื้นหลัง lineup วิดีโอปัจจุบัน ดู ทัวร์โมเดลวิดีโอ OmniArt สำหรับเขียน brief ที่พอร์ตข้ามโมเดล ที่รันช็อต ดู คู่มือการเขียนพรอมป์ต
FAQ
Gemini Omni ประกาศอย่างเป็นทางการแล้วหรือยัง
ยัง ณ 13 พ.ค. 2026 Google ยังไม่ประกาศ Gemini Omni ชื่อผลิตภัณฑ์ model ID และ feature copy มาจาก UI string แอปและรายงาน early tester Google I/O 2026 (19–20 พ.ค.) เป็นหน้าต่างประกาศที่น่าจะเป็น
Gemini Omni จะแทน Veo 3.1 หรือไม่
ยังไม่ชัด สาม scenario ที่เป็นไปได้: Omni rebrand Veo บนพื้นผิว consumer Omni วิ่งข้าง Veo เป็น consumer model Gemini-native หรือ Omni เป็นระบบ omni-modal รวมจริง blend scenario สองและสามน่าจะเป็นมากที่สุดตอน launch
feature อะไรที่รายงานสำหรับ Gemini Omni
รายงานรวม conversational editing ใน Gemini chat workflow remix prompt templates text coherence แข็งในวิดีโอ (สมการคณิตศาสตร์ render สะอาด) และจำกัดคลิป 10 วินาที ไม่มีอย่างใดยืนยันอย่างเป็นทางการ
ควรรอ Omni ก่อนผลิตวิดีโอสัปดาห์นี้ไหม
ไม่ ใช้โมเดลที่ live และเสถียรวันนี้ lineup ครอบคลุมช็อต cinematic broadcast 4K native โซเชียลหลายภาษา iteration เร็ว multi-shot continuity และ VFX ระดับเฟรม ถ้า Omni ship และผ่านเกณฑ์ สลับเข้าได้โดยไม่เขียน pipeline ใหม่
Omni เทียบ Veo 3.1 อย่างไร
จากสเปกที่รายงาน ข edge ของ Omni คือ conversational editing และอาจ typography ในวิดีโอ จุดแข็งยืนยันของ Veo 3.1 คือเสียง native และ output 4K เปรียบเทียบตรงไม่ได้จน Omni available สาธารณะ