คู่มือ prompt และการถ่ายภาพยนตร์ด้วย Veo 3.1 ฉบับสมบูรณ์
วิธีเขียน prompt สำหรับ Veo 3.1 เพื่อผลลัพธ์ระดับ broadcast: 4K แบบ native เสียง spatial audio และการยึดตามเฟรมเริ่มต้นที่แม่นยำ พร้อมสูตร 5 ส่วนที่นำกลับมาใช้ใหม่ได้และตัวอย่างเปรียบเทียบก่อน/หลังใน OmniArt

Veo 3.1 คือโมเดลวิดีโอระดับ broadcast ของ OmniArt ที่คุณจะเลือกใช้เมื่อต้องการผลลัพธ์ที่ดูดีบนหน้าจอขนาดใหญ่ โมเดลนี้รองรับ 4K แบบ native เสียง spatial audio ที่สร้างพร้อมกับเฟรมวิดีโอ และมีความแม่นยำในการยึดตามเฟรมเริ่มต้นที่สูงผิดปกติเมื่อคุณให้ภาพอ้างอิง แต่ทั้งหมดนี้จะไม่มีความหมายหาก prompt ของคุณไม่ชัดเจน คู่มือนี้จะมอบสูตร 5 ส่วนที่นำกลับมาใช้ใหม่ได้สำหรับการกำกับ Veo 3.1 ในแบบที่มันต้องการ พร้อมตัวอย่างเปรียบเทียบก่อน/หลัง ตารางคำศัพท์การถ่ายภาพยนตร์ และคำแนะนำในการเลือกระดับที่เหมาะสม (standard, fast หรือ lite) สำหรับงานแต่ละประเภท
สูตร prompt 5 ส่วนสำหรับ Veo 3.1
Veo 3.1 ตอบสนองได้ดีกับ prompt ที่มีโครงสร้างซึ่งตอบคำถาม 5 ข้อตามลำดับ หากขาดข้อใดข้อหนึ่ง โมเดลจะเติมช่องว่างนั้นเอง ซึ่งมักจะเป็นรูปแบบทั่วไปที่สุดเท่าที่จะเป็นไปได้
- ตัวแสดงและการกระทำ — ใครหรืออะไร กำลังทำอะไร ที่ไหน "ผู้กำกับภาพยนตร์กำลังตรวจดูฟุตเทจคนเดียวในห้องตัดต่อที่มืด"
- กล้อง (การเคลื่อนไหว เลนส์ การจัดเฟรม) — ขนาดของช็อต ความยาวโฟกัส การเคลื่อนไหวและความเร็ว "push-in ช้า 50mm ระยะ medium close-up กล้องล็อกอยู่กับที่แล้วค่อยๆ เลื่อนไปข้างหน้า"
- แสงและอารมณ์ — แหล่งแสง ทิศทาง คุณภาพ โทนสี "แสงจากจอมอนิเตอร์เดียวเป็น key light เงาลึก โทนน้ำเงินเย็น คอนทราสต์สูง"
- เสียงและบรรยากาศ — เสียงในพื้นที่ เสียงเฉพาะ ทิศทางดนตรีหรือ
no music"เสียงฮัมไฟฟ้าเบาๆ เสียงคีย์บอร์ดเป็นระยะ no music" - ข้อมูลทางเทคนิค — ความละเอียด (4K หรือไม่) ความยาวที่ต้องการ การอ้างอิงสไตล์ "4K 8 วินาที photorealistic"
ตัวอย่างที่พัฒนาแล้วอย่างสมบูรณ์
Prompt:
"ผู้กำกับภาพยนตร์กำลังตรวจดูฟุตเทจคนเดียวในห้องตัดต่อที่มืด push-in ช้า 50mm ระยะ medium close-up กล้องล็อกอยู่กับที่แล้วค่อยๆ เลื่อนไปข้างหน้า แสงจากจอมอนิเตอร์เดียวเป็น key light เงาลึก โทนน้ำเงินเย็น คอนทราสต์สูง เสียงฮัมไฟฟ้าเบาๆ เสียงคีย์บอร์ดเป็นระยะ no music 4K 8 วินาที photorealistic"
prompt นี้ใช้เวลาเขียนไม่ถึงสามสิบวินาที มันระบุช็อตในแบบที่ผู้กำกับภาพจะอธิบายกับช่างแสง ทำให้ Veo 3.1 มีพื้นที่สำหรับการเดาผิดน้อยมาก
เคล็ดลับ
no music หากต้องการเสียงห้องที่สะอาดเพื่อนำไปมิกซ์ต่อตารางคำศัพท์การถ่ายภาพยนตร์
คำศัพท์เหล่านี้แปลตรงไปยังการสร้างผลงานของ Veo 3.1 คัดลอกวลีที่ต้องการไปใส่ใน prompt
การเคลื่อนไหวของกล้อง
| การเคลื่อนไหว | วลีสำหรับ prompt |
|---|---|
| เข้าใกล้ช้าๆ | "slow dolly-in", "gentle push-in" |
| ถอยออก | "slow pull-back", "dolly-out to reveal" |
| ติดตามด้านข้าง | "smooth tracking shot from the left", "lateral dolly" |
| ขึ้นไปและเปิดเผย | "slow crane up to reveal the skyline" |
| ความตึงเครียดแบบถือกล้อง | "subtle handheld shake, reactive framing" |
| ล็อก มั่นคง | "tripod-locked", "static wide" |
| โค้งรอบวัตถุ | "slow arc around the subject" |
ขนาดช็อตและมุมกล้อง
| เจตนา | วลีสำหรับ prompt |
|---|---|
| ขนาดและบริบท | "wide 18mm, deep focus, full environment" |
| ตัวแสดงในพื้นที่ | "medium shot, eye level" |
| ความใกล้ชิด | "medium close-up, 50mm" |
| ความเข้มข้น | "tight close-up, 85mm, shallow focus" |
| พลังและความน่ากลัว | "low angle looking up" |
| ความเปราะบาง | "high angle looking down" |
การจัดแสง
| ลักษณะ | วลีสำหรับ prompt |
|---|---|
| ความอบอุ่นตามธรรมชาติ | "golden-hour side light, warm highlights, cool shadows" |
| คอนทราสต์ดรามา | "chiaroscuro, single hard source from camera right" |
| บรรยากาศเมือง | "neon spill, magenta and cyan, reflections in wet pavement" |
| สัมภาษณ์สะอาด | "soft diffused key, slightly warm, low contrast" |
| การปรากฏตัวกลางคืน | "practical light only — a single lamp, deep background falloff" |
ตัวอย่างเปรียบเทียบก่อน/หลัง
A: การกำกับกล้อง — คันโยกเดี่ยวที่ทรงพลังที่สุด
การเปลี่ยนแปลงที่ส่งผลกระทบมากที่สุดต่อ prompt ของ Veo 3.1 คือการเพิ่มการเคลื่อนไหวของกล้องและความยาวโฟกัส เปรียบเทียบ:
ไม่มี: "A street musician playing violin in the rain."
มี: "Medium close-up of a street musician playing violin in the rain. Slow dolly-in, 85mm, shallow depth of field — background traffic dissolving into blur. Practical street-lamp from above, rim-lighting the bow. Light rain sound, distant traffic, no music."
เวอร์ชันที่สองไม่ได้ใช้คำว่า "cinematic" แม้แต่ครั้งเดียว มันระบุสิ่งที่ทำให้ช็อตมีความเป็นภาพยนตร์ และโมเดลก็แสดงผลตามเจตนา แทนที่จะเลือกหนึ่งจากสิบการตีความทั่วไป
B: ความแม่นยำในการยึดเฟรมเริ่มต้นในกระบวนการแปลงภาพเป็นวิดีโอ
Veo 3.1 มีความแม่นยำในการยึดตามภาพสูงเป็นพิเศษเมื่อคุณให้ภาพอ้างอิงเป็นเฟรมเริ่มต้น โมเดลจะรักษาองค์ประกอบ การปรับสี และรายละเอียดตัวละครหลักจากเฟรมแรกและใช้เป็นข้อจำกัดตลอดการสร้าง
การใช้งานจริง: นำภาพนิ่งจากการถ่ายทำเชิงพาณิชย์ ภาพ render ผลิตภัณฑ์ หรือแนวคิดตัวละคร ให้เป็นเฟรมเริ่มต้นในกระบวนการแปลงภาพเป็นวิดีโอของ OmniArt จากนั้นเขียน prompt ที่อธิบายการเคลื่อนไหวจากจุดเริ่มต้นนั้น
Prompt หลังจากให้เฟรมเริ่มต้นจากภาพถ่ายผลิตภัณฑ์:
"ขวดน้ำหอมวางอยู่บนพื้นผิวหินอ่อนสีขาว โค้งช้าๆ จากซ้ายไปขวา ขวดอยู่ตรงกลางตลอดเวลา แสงบ่ายจากหน้าต่างสูงส่องผ่านกระจก จับประกายที่ขอบเหลี่ยม 4K 6 วินาที no music"
โมเดลจะรับช่วงแสงที่แน่นอน ตำแหน่งผลิตภัณฑ์ และพื้นผิวจากภาพอ้างอิงของคุณ และนำการเคลื่อนไหวที่อธิบายไว้ไปใช้ แทนที่จะสร้างฉากใหม่ตั้งแต่ต้น
หมายเหตุ
C: spatial audio จากบรรทัด prompt เดียว
spatial audio ของ Veo 3.1 ไม่ต้องการการประมวลผลแยกต่างหาก บรรทัดเสียงเชิงพรรณนาเพียงบรรทัดเดียวใน prompt ก็เพียงพอที่จะสร้างภูมิทัศน์เสียงที่มีหลายชั้นและรู้ตำแหน่ง
ส่วนหนึ่งของ prompt:
"...เสียง: เสียงฝนที่บันทึกใกล้บนหลังคาเหล็กลูกฟูกด้านบน เสียงฝูงชนตลาดที่ห่างไกล มอเตอร์ไซค์ที่ผ่านมาเป็นครั้งคราวจากขวาไปซ้าย no music"
สิ่งที่โมเดลสร้าง: เสียงฝนมีทิศทาง คุณได้ยินมันอยู่เหนือฉากในเชิงพื้นที่ เสียงฝูงชนตลาดอยู่ในระยะกลาง มอเตอร์ไซค์เคลื่อนผ่านสเตอริโอฟิลด์ตามที่อธิบาย ทิศทางเสียงมาจากสถาปัตยกรรมเสียงดั้งเดิมของ Veo 3.1 ไม่ใช่การประมวลผลหลังการผลิต การตั้งชื่อชั้นเสียงและความสัมพันธ์เชิงพื้นที่ — close, distant, passing left to right — ให้สิ่งที่โมเดลต้องการสำหรับการแสดงผลตามตำแหน่ง
การเลือกระหว่าง standard, fast และ lite
Veo 3.1 มีสามระดับใน OmniArt การเลือกที่ถูกต้องขึ้นอยู่กับงาน ไม่ใช่นิสัยเริ่มต้น
| ระดับ | เมื่อใช้ | ต้นทุนเครดิต |
|---|---|---|
veo-3.1-standard | ผลลัพธ์สุดท้าย การส่งมอบ broadcast การรีวิวลูกค้า ทุกกรณีที่ใช้ 4K | สูงสุดต่อวินาที |
veo-3.1-fast | การทดสอบซ้ำและปรับปรุง prompt ด้วยคุณภาพที่สมเหตุสมผล | ระดับกลาง |
veo-3.1-lite | การทดสอบแนวคิดอย่างรวดเร็ว การตรวจสอบ thumbnail การส่งผ่านการเคลื่อนไหวสำหรับ storyboard | ต่ำสุดต่อวินาที |
เมื่อ 4K คุ้มค่ากับเครดิตเพิ่มเติม: งานส่งมอบสำหรับหน้าจอขนาดใหญ่ ภาพ hero ของผลิตภัณฑ์ ทุกอย่างที่จะ export ในความละเอียดเต็ม หรืองานที่การแสดงผลรายละเอียดของโมเดลในพื้นหลังและพื้นผิวสำคัญต่อโจทย์ 4K มีเฉพาะใน veo-3.1-standard
เมื่อ 4K เป็นการสูญเปล่า: การครอปสำหรับโซเชียลมีเดียที่ 1080p หรือเล็กกว่า การร่างการเคลื่อนไหวที่คุณจะสร้างใหม่อยู่ดี ทุกอย่างที่คุณกำลังสำรวจแทนที่จะส่งมอบ ใช้ veo-3.1-lite สำหรับงานนั้น ทดสอบซ้ำด้วยราคาถูก จากนั้นเปลี่ยนเป็น standard สำหรับรอบสุดท้าย
คำเตือน
ข้อผิดพลาดของ prompt ที่พบบ่อย
ใส่ข้อมูลมากเกินไปในบรรทัดตัวแสดง "ผู้หญิงวัยกลางคนผมหยิกสีแดงสวมเสื้อโค้ทวินเทจยืนอยู่ริมคลองในอัมสเตอร์ดัมถือช่อดอกทิวลิปดูโศกเศร้า" ยัดรายละเอียดมากเกินไปจนโมเดลต้องเลือกเองว่าจะแสดงผลอะไร ใส่เฉพาะสิ่งที่จำเป็นสำหรับช็อตนี้เท่านั้น
คำสั่งกล้องที่ขัดแย้งกัน "Slow push-in with a wide pull-back" เป็นไปไม่ได้ทางกายภาพ โมเดลจะเลือกอย่างใดอย่างหนึ่งและเพิกเฉยต่ออีกอย่าง เขียนการเคลื่อนไหวที่มีแรงจูงใจเดียวต่อ prompt หากต้องการช็อตที่เริ่มต้นแบบกว้างและเข้าใกล้ นั่นคือ push-in เท่านั้น
ลืมเสียงโดยสิ้นเชิง Veo 3.1 จะสร้างเสียงไม่ว่าคุณจะกำกับหรือไม่ก็ตาม การสร้างเสียงที่ไม่มีการกำกับไม่ใช่ความเงียบ แต่เป็นการเดาที่ดีที่สุดของโมเดลซึ่งอาจไม่ตรงกับเจตนาของคุณ ปิด prompt ด้วยบรรทัดเสียงเสมอ แม้เพียง no music, ambient room tone only
เขียน "cinematic" เป็นคำบอกสไตล์ คำว่า "cinematic" ขอให้โมเดลตัดสินใจที่คุณควรตัดสินใจเอง แทนที่ด้วยคุณสมบัติภาพเฉพาะที่คุณต้องการจริงๆ: เลนส์ แสง การเคลื่อนไหว โทนสี
เริ่มต้นบน OmniArt
Veo 3.1 — standard, fast และ lite — มีให้ใช้งานใน พื้นที่ทำงานวิดีโอของ OmniArt พร้อมกับโมเดลอื่นๆ ทุกรูปแบบในไลบรารี วิธีที่เร็วที่สุดในการสร้างทักษะคือนำแนวคิดที่มีอยู่มาหนึ่งอย่าง เขียนตามสูตร 5 ส่วนข้างต้น แล้วสร้างด้วย veo-3.1-fast ก่อนเพื่อปรับปรุง prompt ก่อนที่จะ commit ไปยัง standard
สำหรับคำศัพท์การถ่ายภาพยนตร์ที่กว้างขึ้นและวิธีที่รูปแบบ prompt เดียวกันนี้นำไปใช้กับโมเดลวิดีโอทั้งหมดของ OmniArt ดู คู่มือ prompt วิดีโอ AI เชิงภาพยนตร์ เมื่อพร้อมที่จะเจาะลึกการสร้างเสียงของ Veo 3.1 โดยเฉพาะ คู่มือแนวทางปฏิบัติที่ดีสำหรับ Veo 3.1 spatial audio ครอบคลุมภูมิทัศน์เสียงแบบหลายชั้น สัญญาณเสียงตามตำแหน่ง และทิศทางดนตรีอย่างละเอียด สำหรับการเปรียบเทียบโดยตรงของ Veo 3.1 กับโมเดลชั้นนำอื่นๆ ดู Veo 3.1 vs Sora 2
พร้อมสร้างหรือยัง?
เริ่มสร้างคอนเทนต์ที่ยอดเยี่ยมด้วย AI