guideบทสอนและคู่มืออ่าน 3 นาที

วิธีเขียนพรอมต์ Gemini Omni Flash สำหรับวิดีโอ 10 วินาที

Gemini Omni Flash มีพื้นผิวพรอมต์ที่ไม่เหมือนใคร ไม่มีพารามิเตอร์ negative รองรับสองอัตราส่วนภาพ ใช้ได้เฉพาะภาษาอังกฤษ และมีสองโหมดการเขียนพรอมต์ที่ต่างกัน นี่คือวิธีเขียนทั้งสองโหมดให้ดี

ทีม OmniArt1 ก.ค. 2569

คู่มือพรอมต์วิดีโอ AI ส่วนใหญ่สอนให้คุณเขียนสิ่งเดียว นั่นคือย่อหน้ายาว ๆ ที่ละเอียดสมบูรณ์ซึ่งคุณส่งให้โมเดลเพียงครั้งเดียว แต่ Gemini Omni Flash ทำลายสมมติฐานนั้น API สำหรับนักพัฒนา (เปิดใช้งานตั้งแต่ 30 มิถุนายน) ถูกสร้างขึ้นรอบการเขียนพรอมต์สองแบบที่ต่างกัน คือการสร้างครั้งแรก และการสนทนาแก้ไขที่ดำเนินต่อเนื่อง โดยการแก้ไขแต่ละครั้งจะปรับรูปคลิปเดิมใหม่ ถ้าคุณเขียนสำหรับแบบหนึ่งแล้วละเลยอีกแบบ คุณก็ปล่อยศักยภาพส่วนใหญ่ของโมเดลทิ้งไป

พื้นผิวพรอมต์ของ Omni Flash ยังไม่เหมือนใครในแง่ของสิ่งที่มันตัดออกไป ไม่มีฟิลด์ negative prompt ไม่มีปุ่มปรับ temperature ไม่มี system instruction และมีเพียงสองอัตราส่วนภาพเท่านั้น สิ่งเหล่านี้ไม่ใช่ช่องว่างที่ต้องหาทางเลี่ยงแบบสุ่มสี่สุ่มห้า เพราะแต่ละข้อจะเปลี่ยนวิธีที่คุณควรเรียบเรียงพรอมต์ คู่มือนี้ครอบคลุมทั้งสองโหมดและข้อจำกัดที่กำหนดรูปร่างของมัน

หมายเหตุ

ณ วันที่ 1 กรกฎาคม 2026 Gemini Omni Flash ใช้งานได้ผ่าน Google AI Studio, Gemini API, แอป Gemini และ Google Flow แต่ยังไม่ได้อยู่ใน workspace ของ OmniArt ส่วนด้านล่างนี้อธิบายการเขียนพรอมต์บนเครื่องมือของ Google เองโดยตรง ส่วนท้ายจะแมปว่านิสัยการเขียนแบบใดถ่ายทอดไปยังโมเดลวิดีโอที่ใช้งานได้บน OmniArt แล้ววันนี้

สองโหมดพรอมต์ ไม่ใช่โหมดเดียว

ทุกเซสชันของ Omni Flash มีพรอมต์สองชนิด และแต่ละชนิดตอบสนองต่อการเขียนที่ต่างกัน

พรอมต์สำหรับการสร้างครั้งแรก คือบรีฟที่สมบูรณ์สำหรับจังหวะ 10 วินาทีเดียว ได้แก่ ซับเจกต์ การเคลื่อนไหว กล้อง แสง เสียง สไตล์ มันทำงานเหมือนพรอมต์ text-to-video หรือ image-to-video ที่แข็งแรงทั่วไป คือใส่รายละเอียดไว้ด้านหน้า เจาะจง และอธิบายทั้งช็อตในคราวเดียว

คำสั่งแก้ไขแบบสนทนา ตรงกันข้ามกัน มันสั้น ระบุการเปลี่ยนแปลงเพียงหนึ่งอย่างพอดี และสันนิษฐานว่าโมเดลยังจดจำคลิปก่อนหน้าไว้ในบริบทอยู่แล้ว "ทำให้แสงเป็นแบบ golden hour" "เปลี่ยนรถเก๋งเป็นรถกระบะ" โมเดลจะใช้การเปลี่ยนแปลงนั้นในขณะที่ยังคงรักษาทุกอย่างที่คุณไม่ได้พูดถึงไว้ ผ่าน previous_interaction_id ที่นำสถานะของเซสชันข้ามการแก้ไขต่อเนื่องได้สูงสุดสามครั้งผ่าน Interactions API ถ้าคุณยัดการเปลี่ยนแปลงสามอย่างลงในคำสั่งแก้ไขเดียว คุณก็สูญเสียความแม่นยำที่ทำให้โหมดนี้คุ้มค่าที่จะใช้

แบบจำลองความคิด คือ เรียบเรียงในพรอมต์แรก กำกับในพรอมต์ตามหลัง ทำคลิปฐานให้มั่นคงก่อน แล้วค่อยขัดเกลามันเหมือนที่คุณจะบรีฟผู้กำกับระหว่างถ่ายทำ ทีละหมายเหตุ

ข้อจำกัดของ API ที่กำหนดถ้อยคำของคุณ

รายการพารามิเตอร์ของ Omni Flash สั้นโดยตั้งใจ การละเว้นแต่ละอย่างมีผลต่อการเขียนพรอมต์

ข้อจำกัด	ความหมายต่อพรอมต์
ไม่มีฟิลด์ negative prompt	เรียบเรียงสิ่งที่ต้องการตัดออกไว้ในพรอมต์เอง เช่น "ถนนว่างเปล่า ไม่มีคนเดินเท้า ไม่มีการจราจร" แทนที่จะแยกเป็นรายการ negative
ไม่มี temperature / top_p / system instruction	คุณปรับความแปรปรวนหรือกำหนดกฎสไตล์ถาวรไม่ได้ ต้องใส่โทนและสไตล์ลงในข้อความพรอมต์ทุกครั้ง
อัตราส่วนภาพ 9:16 หรือ 16:9 เท่านั้น	เลือกทิศทางภาพตั้งแต่ต้น ไม่มีตัวเลือกจัตุรัสหรือแบบภาพยนตร์กว้าง ดังนั้นจัดเฟรมสำหรับแนวตั้งหรือแนวนอนตั้งแต่คำแรก
เสียงถูกอธิบาย ไม่เคยอัปโหลด	คุณส่งแทร็กให้มันจับคู่ไม่ได้ ต้องอธิบายเสียงที่ต้องการด้วยคำ (ดูด้านล่าง)
รองรับภาษาอังกฤษเต็มที่ ภาษาอื่นยังไม่ได้ทดสอบ	เขียนพรอมต์เป็นภาษาอังกฤษเพื่อผลลัพธ์ที่คาดเดาได้
จำกัดตายตัวที่ 10 วินาที	หนึ่งการกระทำที่ชัดเจนต่อการสร้าง ไม่ใช่รายการช็อต

คำเตือน

Omni Flash ไม่มีการอัปโหลดเสียงอ้างอิง คุณไม่สามารถให้แทร็กเพลงหรือตัวอย่างเสียงพูดเพื่อให้มันซิงค์ด้วยได้ มันจะสร้างแทร็กเสียงโดยอัตโนมัติ และการควบคุมเดียวที่คุณมีคือคำในพรอมต์ ดังนั้นการออกแบบเสียงต้องถูกเขียน ไม่ใช่แนบมา

เทมเพลตสำหรับการสร้างครั้งแรก

เพราะ 10 วินาทีบรรจุได้เพียงจังหวะเดียว พรอมต์แรกที่แข็งแรงที่สุดจึงอธิบายช่วงเวลาต่อเนื่องเดียวโดยระบุทุกชั้นไว้ครบ หกช่องต่อไปนี้ครอบคลุมเกือบทุกช็อต

ซับเจกต์ — ใครหรืออะไรอยู่บนจอ อธิบายอย่างเป็นรูปธรรม
การเคลื่อนไหว — การกระทำหนึ่งเดียวที่ดำเนินไปตลอดคลิป
กล้อง — การเคลื่อนไหวเดียว ไม่ใช่ลำดับ ("ค่อย ๆ ดันเข้า", "ตั้งกล้องนิ่งภาพกว้าง")
แสง — ทิศทาง คุณภาพ ช่วงเวลาของวัน
การออกแบบเสียง — เสียงที่ต้องการให้สร้าง อธิบายเป็นคำ
สไตล์ — โทนสี ยุคสมัย การอ้างอิงฟิล์ม พื้นผิว

ตัวอย่างที่เขียนจริง

"A ceramic pour-over coffee dripper on a pale oak counter, steam rising as dark coffee streams into the glass carafe below. Slow push in on the drip. Soft morning light from a window camera-left, warm and diffused. Sound: gentle water trickle, distant kitchen ambience, no music. Muted editorial palette, shallow depth of field, shot on a fast prime lens."

สังเกตว่าสิ่งที่ตัดออกอยู่ภายในประโยค ("no music") กล้องเป็นการเคลื่อนไหวเดียว และเสียงถูกระบุออกมาชัดเจน นั่นคือวินัยทั้งหมด

การแก้ไขแบบสนทนา คำศัพท์ที่ได้ผล

เมื่อคุณมีคลิปฐานแล้ว การแก้ไขคือจุดที่ Omni Flash ทิ้งห่างเวิร์กโฟลว์แบบสร้างแล้วทิ้ง เก็บแต่ละคำสั่งให้มีเจตนาเดียว และพึ่งคำศัพท์กริยาที่สม่ำเสมอซึ่งโมเดลอ่านได้อย่างชัดเจน

ปรับแสงใหม่ — "make it golden hour", "add a cool rim light from behind"
แทนที่ — "swap the coffee dripper for a French press"
เปลี่ยนสไตล์ — "make it feel like 1970s film stock"
เปลี่ยนสี — "change the mug to matte black"
ปรับจังหวะเวลา — "slow the pour down", "let the steam linger longer"

สองกฎช่วยให้เธรดสอดคล้องกัน หนึ่งการเปลี่ยนแปลงต่อหนึ่งรอบ โมเดลรักษาสิ่งที่คุณไม่ได้พูดถึงไว้ ดังนั้นการแก้ไขทีละหมายเหตุจึงทั้งคาดเดาได้มากกว่าและย้อนกลับได้ง่ายกว่าด้วยการเขียนพรอมต์ใหม่ และ ต่อยอดจากภาษาของรอบก่อนหน้า ใช้คำนามที่คุณตั้งไว้ซ้ำ ("the mug", "the pour") เพื่อให้โมเดลยึดกับองค์ประกอบเดิมแทนที่จะอนุมานฉากใหม่

เคล็ดลับ

สายการแก้ไขสามครั้งคืองบประมาณ ไม่ใช่ข้อเสนอแนะ วางแผนพรอมต์ฐานให้ต้องการพรอมต์ตามหลังน้อยที่สุด การสร้างครั้งแรกที่แข็งแรงจะเก็บรอบการแก้ไขของคุณไว้สำหรับการเปลี่ยนแปลงเชิงสร้างสรรค์ที่แท้จริง ไม่ใช่สำหรับซ่อมสิ่งที่พรอมต์แรกควรจะระบุไว้ได้

การทำงานภายใต้ข้อจำกัดปัจจุบัน

ข้อจำกัดบางอย่างแก้ด้วยพรอมต์ไม่ได้ และคุ้มค่าที่จะเขียนพรอมต์โดยคำนึงถึงมันแทนที่จะต่อสู้กับมัน

เพดาน 10 วินาที ไม่มีการต่อฉากใน API ดังนั้นอย่าเขียนพรอมต์ที่สื่อถึงเรื่องราวที่ยาวกว่านั้น ออกแบบจังหวะเดียวที่ยืนได้ด้วยตัวเอง
ความสม่ำเสมอของตัวละครข้ามการเปลี่ยนฉาก เป็นจุดอ่อนที่ได้รับการยอมรับ ถ้าความเหมือนสำคัญ ให้เก็บการแก้ไขไว้ในฉากเดียวกันแทนที่จะขอให้โมเดลย้ายตัวละครไปยังฉากใหม่
วิดีโออ้างอิงที่ยาวเกิน 3 วินาทีจะไม่ถูกประมวลผลเต็มที่ เก็บคลิปอ้างอิงใด ๆ ให้สั้นและตรงประเด็น
ไม่มีการอ้างอิงหลายวิดีโอและไม่มีการแก้ไขเสียงพูด ทั้งสองอย่างไม่รองรับ ดังนั้นวางแผนขั้นตอนเหล่านั้นไว้ในเครื่องมือแยกต่างหากแทนที่จะอยู่ในพรอมต์

ไม่มีข้อใดเลยที่ทำให้ Omni Flash หมดสิทธิ์เป็นเครื่องมือวนซ้ำแบบสั้นและรวดเร็ว เพียงแต่หมายความว่า Omni Flash ตอบสนองดีกับพรอมต์ที่ขอบเขตตรงกับสิ่งที่มันทำได้ดี คือจังหวะกระชับเดียวที่ขัดเกลาด้วยการสนทนา

อะไรถ่ายทอดมายัง OmniArt ได้แล้ววันนี้

Omni Flash ยังไม่อยู่ใน workspace ของ OmniArt แต่แทบทุกนิสัยข้างต้นถ่ายทอดไปยังโมเดลวิดีโอที่อยู่แล้วได้ เพราะวินัยพื้นฐาน (จังหวะที่ชัดเจนเดียว ความเจาะจงเหนือกองคำคีย์เวิร์ด เสียงที่เขียนลงในพรอมต์) ไม่ขึ้นกับโมเดลใดโมเดลหนึ่ง

การสร้างที่ขับเคลื่อนด้วยการอ้างอิง แมปตรงไปยัง Seedance 2.0 ที่ใช้งานได้บน OmniArt ซึ่งรับได้สูงสุดเก้ารูปภาพ สามวิดีโอ และสามไฟล์เสียงที่ผูกกับบทบาทด้วยไวยากรณ์ @image1 / @video1 คือแนวคิด "เรียบเรียงจากทรัพย์สิน" ที่มีอินพุตมากกว่าที่ Omni Flash ให้
ภาษากล้องแบบภาพยนตร์ แมปไปยัง Veo 3.1 ซึ่งตีความกริยาการเคลื่อนไหวอย่าง "drift", "glide" และ "dolly in" ด้วยความยับยั้งชั่งใจ
เทมเพลตหกช่อง (ซับเจกต์ การเคลื่อนไหว กล้อง แสง เสียง สไตล์) คือโครงเดียวกันที่ให้ผลลัพธ์สะอาดบนทุกโมเดลวิดีโอใน workspace

เปิด video workspace บน OmniArt เลือกโมเดลที่เหมาะกับช็อต แล้วเขียนพรอมต์แรกเป็นจังหวะสมบูรณ์เดียว เมื่อ Omni Flash มาถึง เวิร์กโฟลว์สองโหมดข้างต้นคือส่วนที่คุณจะเพิ่มเข้าไป ส่วนฝีมือการเขียนพรอมต์นั้นเหมือนกันอยู่แล้ว

พร้อมสร้างหรือยัง?

เริ่มสร้างคอนเทนต์ที่ยอดเยี่ยมด้วย AI

เริ่มฟรี