tutorialบทความและเคล็ดลับอ่าน 3 นาที

วิธีเขียนพรอมต์ Seedance ด้วยวิธี Vibe Creating

เรียนรู้วิธี Vibe Creating สำหรับเขียนพรอมต์ Seedance บน OmniArt โครงสร้าง 4 ชั้น เวลาไหนควรไว้ใจโมเดล พร้อมตัวอย่างก่อนและหลัง

ทีม OmniArt
วิธีเขียนพรอมต์ Seedance ด้วยวิธี Vibe Creating

คนส่วนใหญ่เขียนพรอมต์ Seedance เหมือนกับกำลังเขียนรายงานกล้อง ทั้งทางยาวโฟกัส การขยับริก หมายเลขช็อต อุณหภูมิสี ดูเหมือนแม่นยำ แต่มักได้วิดีโอที่แข็งทื่อและควบคุมมากเกินไป ทีม Seedance ส่งเสริมแนวทางที่แตกต่างออกไปซึ่งเรียกว่า Vibe Creating โดยแก่นกลางของแนวคิดนี้ฟังดูขัดกับสัญชาตญาณ นั่นคือโมเดลที่มีความสามารถสูงต้องการให้คุณสื่อ เจตนา ไม่ใช่ควบคุมการทำงานทุกอย่างด้วยตนเอง

คู่มือนี้แตกวิธี Vibe Creating ออกเป็นสิ่งที่คุณนำไปใช้กับการสร้างวิดีโอครั้งต่อไปได้เลย คุณจะได้เรียนรู้โครงสร้างพรอมต์ 4 ชั้น ว่าทำไม "ไว้ใจโมเดล" ถึงชนะการสะสมคำสั่ง ภาษากล้องแบบไหนควรตัดออกและแบบไหนควรเก็บไว้ และสถานการณ์ไหนที่การควบคุมแบบละเอียดยังคงได้เปรียบ Seedance 2.0 ทั้งรุ่น standard และ fast ให้บริการบน OmniArt พร้อมกับโมเดลวิดีโออื่น ๆ คุณจึงทดสอบแต่ละแนวคิดไปพร้อมกับการอ่านได้เลย

ลำดับวิดีโอ AI ที่มีทิศทางชัดเจน — คลิปตัวอย่างจากคู่มือ Vibe Creating ของ ByteDance สำหรับ Seedance

หมายเหตุ

คลิปตัวอย่างในบทความนี้มาจากคู่มือปฏิบัติ "Vibe Creating" ของ Seedance โดย ByteDance นำมาใช้เพื่ออธิบายวิธีการเขียนพรอมต์ หลักการเดียวกันนี้ใช้ได้กับโมเดลวิดีโอที่มีทิศทางทุกตัวบน OmniArt ไม่เพียงแค่ Seedance

Vibe Creating หมายความว่าอะไร

Vibe Creating คือการปรับเปลี่ยนว่าใครทำอะไร นิสัยเก่าคือการมองโมเดลเป็นแค่ renderer โง่ ๆ ที่ต้องระบุพารามิเตอร์ทุกตัว ส่วน Vibe Creating มองมันเป็นผู้ร่วมงานที่มีความสามารถ คุณส่งมอบ ความรู้สึก และ เจตนา แล้วปล่อยให้โมเดลจัดการรายละเอียดทางภาพเอง

ไม่ได้หมายความว่าต้องเขียนน้อยลงเพื่อความน้อยลง และไม่ได้หมายความว่าพรอมต์ต้องคลุมเครือ พรอมต์อย่าง "อิสรภาพ" หรือ "ความรู้สึกพรีเมียม" ไม่มีจุดยึดให้โมเดลเลย เป้าหมายคือตัดเสียงรบกวนทางเทคนิคที่คุณค่าต่ำออก แล้วเก็บหรือเพิ่มข้อมูลที่ทำให้ช็อตยืนหยัดได้จริง ว่าเรากำลังมองดูอะไรหรือใคร มีอะไรเกิดขึ้น และควรรู้สึกอย่างไร

โครงสร้างพรอมต์ 4 ชั้น

กระดูกสันหลังของพรอมต์ Seedance ที่แข็งแกร่งประกอบด้วยข้อมูล 4 ชั้น เมื่อผลลัพธ์ออกมาบางหรือทั่วไปเกินไป สาเหตุมักมาจากขาดชั้นใดชั้นหนึ่งเหล่านี้

ชั้นคืออะไรตัวอย่าง
จุดยึดทางภาพซับเจกต์หรือองค์ประกอบที่สำคัญที่สุดเพียงหนึ่งเดียว"ผู้อาวุโสในเสื้อผ้าฝ้ายเก่า" หรือ "ถนนสว่างด้วยไฟนีออนในสายฝน"
การกระทำหรือสภาวะสิ่งที่กำลังทำหรือสภาวะที่เป็นอยู่ เลือกอย่างใดอย่างหนึ่ง"หันมาทางกล้องอย่างช้า ๆ" หรือ "สายฝนไหลลงกระจก"
โทนสีเฉพาะที่ความรู้สึกของช็อตนี้ในคำหรือสองคำ"แสงหลังอบอุ่นสีอำพัน" หรือ "การสั่นไหวเล็กน้อยแบบ handheld"
ธีมวิดีโอกรณีการใช้งานบวกกับสไตล์ภาพของผลงาน"หนังสั้นเกี่ยวกับการจากลา" หรือ "ซีนีมาติก cyberpunk เกม"

ไม่จำเป็นต้องตรวจสอบตัวเองผ่านทั้ง 4 ชั้นทุกครั้ง ให้คิดว่ามันเป็นเช็กลิสต์สำหรับ ทำไมช็อตถึงรู้สึกแบน บ่อยครั้งที่สุดคือขาดจุดยึดทางภาพหรือการกระทำ และการเพิ่มแค่ชั้นเดียวนั้นก็แก้ได้แล้ว

นี่คือความแตกต่างในทางปฏิบัติ พรอมต์ทั้งสองด้านล่างอธิบายแนวคิดเดียวกัน ได้แก่ คนในรถไฟฟ้าใต้ดินที่ถูกน้ำท่วมกับวาฬอยู่ข้างนอก แต่อันที่สองเติมเต็มทั้ง 4 ชั้นแทนที่จะแค่ตั้งชื่อฉาก

พรอมต์ทั่วไป: "คนยืนอยู่ในรถไฟฟ้าใต้ดินที่เต็มไปด้วยน้ำทะเล วาฬว่ายน้ำผ่านหน้าต่างข้างนอก เงียบงันและอึดอัด"

Vibe Creating: "ภายในรถไฟฟ้าใต้ดินที่จมอยู่ใต้น้ำทะเลครึ่งคัน คนหนึ่งยืนเงียบ ๆ ภายในแช่อยู่ในแสงสีน้ำเงินเข้มใต้น้ำ ราวจับ เบาะนั่ง และหน้าต่างชุ่มโชกด้วยความเงียบสงัดและเย็นชื้น ข้างนอก โลกกลายเป็นมหาสมุทรลึก และวาฬยักษ์ร่อนผ่านหน้าต่างอย่างช้า ๆ ร่างกายอันยิ่งใหญ่ของมันบังแสงในตู้โดยสารขณะผ่านไป"

พรอมต์ทั่วไป

Vibe Creating

แนวคิดเดียวกัน เติมเต็ม 4 ชั้น: พรอมต์ที่สองแสดงถึงอารมณ์ที่ตั้งใจ ทั้งความกดดันและความเงียบ ได้น่าเชื่อถือกว่ามาก

ทั้งสองเป็นพรอมต์ที่ถูกต้อง แต่อันที่สองให้โทนสี (แสงสีน้ำเงินเข้ม ความเงียบเย็นชื้น) และการกระทำที่ชัดเจน (วาฬร่อนผ่าน) แก่โมเดล ผลลัพธ์จึงถ่ายทอดความรู้สึกที่ผู้สร้างต้องการได้จริง

ไว้ใจโมเดล — ให้ข้อมูลในปริมาณที่เหมาะสม

ความผิดพลาดที่พบบ่อยที่สุดคือการควบคุมมากเกินไป สะสมพารามิเตอร์โดยเชื่อว่าคำสั่งยิ่งมากยิ่งได้ผลลัพธ์ตรงใจ แต่ในทางปฏิบัติ การให้โมเดลมีพื้นที่ทำงานกลับได้การเคลื่อนไหวที่นุ่มนวลกว่า การเปลี่ยนผ่านที่เป็นธรรมชาติกว่า และผลลัพธ์ที่ดูมีสไตล์ซีนีมาติกกว่า

ลองเปรียบเทียบสองแนวทางสำหรับแนวคิดเดียวกัน ได้แก่ เด็กชายดินปั้นที่พลาดเท้าแล้วตกลงผ่านอุโมงค์เหนือจริงของโลกต่าง ๆ พรอมต์แรกล็อกสไตล์ สี เลนส์ และคิวดนตรี ส่วนที่สองอธิบายประสบการณ์แล้วปล่อยให้โมเดลกำกับเอง

พรอมต์ทั่วไป: "สไตล์ภาพ: คลาเมชันสต็อปโมชัน ถนนในโลกจริง: สีเทาเย็น โทนมืด ฉากตกหล่น: แสงวาบรัว สีระเบิดไปทุกทิศ สนามหญ้าปลายทาง: แสงแดดสดใส โทนย้อนยุคผ่อนคลาย ช็อตเลนส์บิดเบือน 85mm การขยับ dolly BGM: บทนำเปียโนมินิมอล การสร้างซินธ์เชิงทดลอง"

Vibe Creating: "บนถนนยามบ่ายธรรมดา เด็กชายดินปั้นแบกเป้สะพายหลังพองโต เดินก้มหน้าดูดูดอยู่กับการเตะก้อนกรวด โดยไม่ทันตั้งตัวเขาก้าวพลาดลงในฝาท่อระบายน้ำที่เปิดอยู่มืดสนิท ขณะที่เขาดิ่งลง ลมหวีด ไร้น้ำหนัก ใบหน้าเต็มไปด้วยความตื่นกลัว ป้ายนีออน cyberpunk แมงกะพรุนเรืองแสงใต้ทะเล ดาวเคราะห์ไกล ๆ และเนบิวลาที่ลอยอยู่ผ่านไปในแสงแฟลชระริก จนถึงขณะที่ทุกอย่างกำลังจะปั่นป่วน เสียงและการตกหล่นก็หายวับไปในจังหวะเดียว"

พรอมต์ทั่วไป

Vibe Creating

ระบุเกินไปกับการให้อิสระ: เมื่อโมเดลมีพื้นที่ตีความ ได้งานกล้องที่นุ่มนวลกว่าและความรู้สึกการตกหล่นที่แรงกว่า

เรื่องราวที่สมบูรณ์กว่าไม่ใช่สิ่งเดียวกับการสะสมคำสั่ง ตัวอย่างต่อไปแสดงว่าคุณ สามารถ เก็บเจตนาของกล้องไว้ได้ ตราบใดที่มันรับใช้เรื่องราวแทนที่จะบังคับอุปกรณ์

พรอมต์ทั่วไป: "ช็อต 1: prime 85mm f1.4 contrast +10 vignette +15 ช็อต 2: tracking ที่ 0.7x ช็อต 3: medium shot ซับเจกต์ซ้ายกึ่งกลาง อุณหภูมิสี 4200K แผงซ่อมนาฬิกาในตรอกเก่า ผู้อาวุโสใส่แว่นอ่านหนังสือกำลังหมุนเม็ดมะยมนาฬิกาพก เด็กในชุดนักเรียนวิ่งเข้ามาถือลูกกวาดหน้าลายที่เสียบไม้ ผู้อาวุโสส่งนาฬิกาการ์ตูนที่ซ่อมแล้วให้"

Vibe Creating: "ที่แผงซ่อมนาฬิกาในตรอกเก่า ผู้อาวุโสใส่แว่นก้มดูนาฬิกาพกที่เก่าคร่ำ กล้องเริ่มจากมุมสูงเล็กน้อยชิดมือที่จดจ่อของเขา หลานน้อยวิ่งเข้ามาถือลูกกวาดหน้า กล้องตามก้าวเบาเร็วของเด็กน้อย ผู้อาวุโสแหงนมองยิ้ม แล้วส่งนาฬิกาการ์ตูนที่เพิ่งซ่อมเสร็จให้ medium shot เผยสายใยระหว่างพวกเขา อบอุ่น คิดถึง มีความใกล้ชิดที่อยู่กับชีวิตในตรอกเก่า"

พรอมต์ทั่วไป

Vibe Creating

พรอมต์ที่สองเก็บเจตนาของกล้องไว้ (ตามเด็ก หยุดที่ความสัมพันธ์) แต่ตัดพารามิเตอร์ออก และอ่านออกมาเป็นฉากที่อบอุ่นและเชื่อมโยงกันมากกว่า

ภาษากล้อง: ตัดอะไรออก เก็บอะไรไว้

ภาษากล้องไม่ได้ผิดทั้งหมด เคล็ดลับคือแยกคำสั่งที่บอก ระบบว่าต้องถ่ายอย่างไร ออกจากเจตนาที่บอก ผู้ชมว่าต้องรู้สึกอย่างไร

ตัดสิ่งเหล่านี้ออก เป็นการควบคุมทางเทคนิคที่คุณค่าต่ำที่จำกัดโมเดล:

  • ค่าทางยาวโฟกัสและมิลลิเมตร
  • ศัพท์ตำแหน่งกล้องและอุปกรณ์ กล้อง A/B การครอบคลุม
  • พารามิเตอร์การขยับและตัวคูณความเร็ว
  • หมายเลขช็อต
  • ความชัดลึก รูรับแสง การรับแสง ชัตเตอร์
  • คำสั่งตัดต่อล้วน ๆ

เก็บและแปลสิ่งเหล่านี้ไว้ เป็น เจตนา ของกล้องที่กำหนดความรู้สึก:

  • เปลี่ยน "dolly เข้าช้า ๆ" เป็น "สายตาถูกดึงเข้าไปใกล้ขึ้น ความรู้สึกกดดันเงียบ ๆ"
  • เปลี่ยน "handheld" เป็น "การสั่นไหวเล็กน้อยที่กระวนกระวาย"
  • เก็บทุกอย่างที่บอกผู้ชมว่าต้องรู้สึกอะไร โดยแสดงเป็นผลลัพธ์ไม่ใช่การตั้งค่า

ประเด็นไม่ใช่การตัดภาษาการเคลื่อนไหวทั้งหมด แต่คือการแสดงออกเป็นประสบการณ์ที่โมเดลตีความได้ ไม่ใช่ตัวเลขที่ต้องปฏิบัติตาม

เก็บข้อจำกัดที่แน่ชัดของคุณไว้

Vibe Creating เขียนใหม่เฉพาะ ภาพ ไม่ใช่สิ่งที่คุณระบุไว้อย่างชัดเจน บทสนทนา คำบรรยาย เนื้อเพลง คิวดนตรี และเอฟเฟกต์เสียงเป็นข้อจำกัดที่แน่ชัด หากคุณเขียนไว้แล้วให้เก็บไว้คำต่อคำ เรียงลำดับใหม่ได้หากจำเป็น แต่อย่าให้การ "ปรับปรุง" พรอมต์ไปอ้อมหรือตัดออก

แนวทางปฏิบัติ: เมื่อภาพและเสียงปะปนกันในพรอมต์เดียว เขียนคำอธิบายภาพใหม่อย่างอิสระ แต่ดึงบรรทัดและคิวเสียงที่แน่ชัดออกมาและเก็บไว้คำต่อคำ

เมื่อไหรที่ไม่ควรใช้ Vibe Creating

Vibe Creating แข็งแกร่งที่สุดสำหรับบรรยากาศ อารมณ์ ความรู้สึกเชิงเรื่องเล่า และการเชื่อมโยงทางภาพ แต่เป็นเครื่องมือที่ไม่เหมาะเมื่องานมีมาตรฐานส่งมอบที่เข้มงวด ใช้การควบคุมแบบพารามิเตอร์ที่แม่นยำเมื่อคุณต้องการ:

  • การซิงค์ริมฝีปากทีละคำที่แน่นอนตลอดบทสนทนายาว
  • การแนะนำฟีเจอร์ เดโม UI หรือวิดีโอสอนแบบทีละขั้นตอน
  • งานส่งมอบเชิงอุตสาหกรรมตามรายการช็อตที่ล็อกไว้และพารามิเตอร์ที่กำหนด

ในกรณีเหล่านั้น ความแม่นยำ คือ จุดประสงค์ ใช้ Vibe Creating กับช็อตที่ความรู้สึกสำคัญกว่าสเปก และสลับโหมดอย่างจงใจสำหรับส่วนที่เหลือ

เริ่มต้นบน OmniArt

คุณนำสิ่งนี้ไปปฏิบัติได้เดี๋ยวนี้เลย Seedance 2.0 ทั้งรุ่น standard และ fast ให้บริการบน พื้นที่สร้างวิดีโอ ของ OmniArt พร้อมกับโมเดลวิดีโอที่มีทิศทางอื่น ๆ ที่คุณใช้วิธีเดียวกันได้

วิธีเริ่มต้นง่าย ๆ:

  1. เขียน จุดยึดทางภาพ และ การกระทำ หนึ่งอย่างก่อน นี่คือกระดูกสันหลังของช็อต
  2. เพิ่มคำ โทนสี หนึ่งคำและ ธีม เพื่อให้โมเดลรู้สไตล์และกรณีการใช้งาน
  3. ลบทางยาวโฟกัส หมายเลขช็อต และศัพท์อุปกรณ์ออก แปลการเคลื่อนไหวของกล้องให้เป็นสิ่งที่ควร รู้สึก อย่างไร
  4. เก็บบทสนทนา คำบรรยาย และคิวดนตรีไว้ตามที่เขียนไว้

หากคุณติดตามว่า AI วิดีโอที่มีทิศทางกำลังมุ่งไปทางไหน บทวิเคราะห์ สิ่งที่เปิดตัวใน Seedance 2.5 ของเราครอบคลุมการสร้างช็อตเดียวยาวขึ้นและเวิร์กโฟลว์ multi-reference ที่ทำให้สไตล์การเขียนพรอมต์นี้มีประโยชน์ยิ่งขึ้น เปิด workspace เขียน 4 ชั้นอย่างจริงใจ แล้วปล่อยให้โมเดลกำกับส่วนที่เหลือ

พร้อมสร้างหรือยัง?

เริ่มสร้างคอนเทนต์ที่ยอดเยี่ยมด้วย AI

เริ่มฟรี