จากภาพผลิตภัณฑ์สู่โฆษณาเคลื่อนไหว: แนวทางปฏิบัติที่ดีสำหรับ Grok Imagine 1.5 แบบสร้างวิดีโอจากภาพ
โหมดที่แข็งแกร่งที่สุดของ Grok Imagine 1.5 คือการแปลงภาพผลิตภัณฑ์ให้เป็นโฆษณาเคลื่อนไหว ครอบคลุมกฎภาพต้นฉบับ สูตร prompt ห้าส่วน ขั้นตอนการทำงาน 480p-720p และตัวอย่างที่ใช้งานได้จริงสี่ชิ้นใน OmniArt

โหมดสร้างวิดีโอจากภาพของ Grok Imagine 1.5 เชี่ยวชาญในสิ่งเดียวเป็นพิเศษ นั่นคือการนำภาพผลิตภัณฑ์ที่สะอาดมาแปลงเป็นคลิปโฆษณาเคลื่อนไหวโดยไม่ต้องสร้างผลิตภัณฑ์ขึ้นใหม่จากคำอธิบายข้อความ เครื่องยนต์ Aurora ยึดตำแหน่งของวัตถุ แสง และเส้นทางกล้องจากภาพต้นฉบับ ทำให้รองเท้าผ้าใบยังคงสีขาวที่ถูกต้องและตัวเลขบนหน้าปัดนาฬิกายังอ่านออก ซึ่งเป็นสิ่งที่การสร้างวิดีโอจากข้อความไม่สามารถรับประกันได้สำหรับสินค้าที่คุณขายจริง
คู่มือนี้ครอบคลุมเสาหลักสามประการที่กำหนดว่าคลิป Grok Imagine 1.5 แบบสร้างวิดีโอจากภาพจะใช้งานได้ตั้งแต่ครั้งแรกหรือไม่ ได้แก่ คุณภาพของภาพต้นฉบับ การสร้าง prompt และขั้นตอนการทำงานด้านความละเอียดจาก 480p ถึง 720p ตัวอย่างที่ใช้งานได้จริงสี่ชิ้น ได้แก่ รองเท้าผ้าใบ นาฬิกา กระเป๋าถือ และผลิตภัณฑ์ความงาม แสดงให้เห็นการประยุกต์ใช้แต่ละเสาหลักตั้งแต่ต้นจนจบ
สำหรับขั้นตอนการทำงานโฆษณา e-commerce ที่กว้างกว่าซึ่งครอบคลุมการเลือกโมเดล รูปแบบแพลตฟอร์ม และเสียง ดูได้ที่ แปลงภาพผลิตภัณฑ์เป็นโฆษณาวิดีโอด้วย OmniArt บทความนี้มุ่งเน้นเฉพาะการได้ผลลัพธ์ที่ดีที่สุดจาก Grok Imagine 1.5
สิ่งที่ Grok Imagine 1.5 นำมาสู่การสร้างวิดีโอจากภาพ
| ข้อมูลจำเพาะ | ค่า |
|---|---|
| ความละเอียด | สูงสุด 720p |
| อัตราเฟรม | 24 fps |
| ความยาว | 1–15 วินาที |
| เสียงพื้นฐาน | ใช่ — สร้างในรอบการอนุมานเดียวกัน |
| พื้นฐานภาพ | FLUX.1 (Black Forest Labs) |
| อันดับในเวที | อันดับ 1 ใน Image-to-Video Arena (+52 Elo เหนือเวอร์ชัน 1.0) |
พื้นฐาน FLUX.1 คือเหตุผลที่การใช้ภาษาธรรมชาติใน prompt ทำงานได้ที่นี่ คุณอธิบายภาพเหมือนกำลังบรีฟผู้บังคับกล้อง ไม่ใช่การเรียงคำสำคัญจากคลัง OpenCLIP จากนั้นเครื่องยนต์ Aurora ใช้ภาพต้นฉบับเป็นจุดอ้างอิงพื้นที่หลัก รักษาโครงร่าง สี และตำแหน่งสัมพัทธ์ของวัตถุให้คงที่ในขณะที่กล้องและแสงเคลื่อนไปรอบๆ
OmniArt นำเสนอ Grok Imagine ไว้ในพื้นที่ทำงานวิดีโอพร้อมกับโมเดลอื่นทั้งหมด ไม่จำเป็นต้องสมัครสมาชิก xAI แยกต่างหาก อัตราเครดิตคือ 10 เครดิตต่อวินาทีที่ 480p และ 15 เครดิตต่อวินาทีที่ 720p หมายความว่าแบบร่าง 5 วินาทีที่ 480p ใช้ 50 เครดิต และแบบเดียวกันที่ 720p ใช้ 75 เครดิต
เสาหลักที่ 1: คุณภาพของภาพต้นฉบับ
เครื่องยนต์ Aurora ยึดองค์ประกอบภาพจากเฟรมต้นฉบับ อินพุตที่แข็งแกร่งสร้างการเคลื่อนไหวที่ยึดมั่น ส่วนอินพุตที่อ่อนแอทำให้เกิดการเลื่อนไหล เพราะโมเดลต้องอินเทอร์โพเลตสิ่งที่อ่านไม่ชัด และความแม่นยำลดลง
รายการตรวจสอบภาพต้นฉบับ
| ควรทำ | ไม่ควรทำ |
|---|---|
| ใช้พื้นหลังที่สะอาดและไม่รก (สีขาว เทาอ่อน หรือบริบทไลฟ์สไตล์ที่มีพื้นที่หายใจ) | ใช้พื้นหลังที่ยุ่งเหยิงจนผลิตภัณฑ์หายไปในนั้น |
| ถ่ายหรือครอปให้ผลิตภัณฑ์เต็ม 50–70% ของเฟรม | ใช้ภาพผลิตภัณฑ์ที่ครอปมากเกินไปหรือขอบถูกตัด |
| รักษาความคมชัดระหว่างวัตถุกับพื้นหลังให้สูง | ใช้ภาพที่สีผลิตภัณฑ์เหมือนพื้นหลัง |
| รักษาข้อความ โลโก้ และฉลากให้อยู่ในโฟกัสและอ่านออก | ใช้ภาพที่มีอาร์ทิแฟกต์จากการบีบอัด JPEG มาก |
| ทำงานจากไฟล์ต้นฉบับที่ความละเอียดสูงสุด (ขั้นต่ำ 1024 × 1024) | ใช้ภาพย่อหรือภาพเว็บที่ลดขนาดแล้ว |
| ใช้วัตถุหลักหนึ่งชิ้นต่อเฟรม | ใช้การจัดวางแบบ flat lay ที่มีผลิตภัณฑ์ห้าชิ้น |
| ตรวจสอบว่ารายละเอียดที่กำหนดลักษณะผลิตภัณฑ์ (พื้นรองเท้า หน้าปัด ตัวล็อค ฝาปิด) มองเห็นได้ชัด | ใช้มุมถ่ายที่ซ่อนจุดเด่นของผลิตภัณฑ์ |
คำเตือน
ทำไมถึงสำคัญกว่าสำหรับ Grok มากกว่าการสร้างวิดีโอจากข้อความ
เมื่อสร้างวิดีโอจากข้อความ คุณอธิบายผลิตภัณฑ์และโมเดลสร้างสิ่งที่เหมาะกับคำอธิบายของคุณ เมื่อสร้างวิดีโอจากภาพ โมเดลมุ่งมั่นที่จะเคารพผลิตภัณฑ์จริงของคุณ แต่ทำได้เพียงในระดับที่สามารถอ่านจากเฟรมต้นฉบับได้ ภาพที่ความละเอียดต่ำหรือคลุมเครือทางสายตาเป็นสาเหตุที่พบบ่อยที่สุดที่ทำให้ผลลัพธ์ของ Grok Imagine 1.5 แบบสร้างวิดีโอจากภาพน่าผิดหวัง
เสาหลักที่ 2: สูตร prompt ห้าส่วน
Grok Imagine 1.5 ใช้ FLUX.1 เป็นพื้นฐานภาพ ซึ่งให้รางวัลกับคำอธิบายภาษาธรรมชาติมากกว่าการเรียงสตริงคำสำคัญ ห้าส่วนด้านล่างสอดคล้องกับสิ่งที่เครื่องยนต์การเคลื่อนไหวของ Aurora สามารถทำงานได้โดยตรง
สูตร
[การกระทำ] — [แสง] — [จังหวะ] — [พื้นหลัง] — [บรรยากาศ/อ้างอิง]
รายละเอียดแต่ละส่วน:
-
การกระทำ — การเคลื่อนไหวของกล้องหรือวัตถุ ระบุให้ชัดเจน เช่น "dolly เข้าช้าๆ จากระดับเอว" "pan โคจรรอบด้านซ้าย" "ลอยขึ้นแนวตั้งเบาๆ 3 ซม. แล้วลงมา" คำที่คลุมเครือ เช่น "ไดนามิก" ให้โมเดลมีอิสระมากเกินไปและสร้างผลลัพธ์ที่ไม่สม่ำเสมอ
-
แสง — อธิบายทิศทาง คุณภาพ และแหล่งกำเนิดแสง "rim light จากด้านหลังพร้อม key light ทังสเตนอบอุ่นทางซ้ายของกล้อง" ดีกว่า "แสงดราเมติก" อุณหภูมิสีที่เฉพาะเจาะจง ("3200K" "5600K แสงกลางวัน") หรือคุณภาพแสงที่มีชื่อเฉพาะ ("fill จาก softbox" "เงาแข็ง 45 องศา") จะยึดรูปลักษณ์ไว้ได้
-
จังหวะ — ความเร็วและจังหวะของการเคลื่อนไหว "push ช้า 2 วินาที ไม่มีการเร่งความเร็ว" "ความรู้สึก 0.5× ของการเล่น" "ไม่รีบร้อน บรรณาธิการ" หากไม่ระบุจังหวะที่ชัดเจน โมเดลจะใช้การเคลื่อนไหวปานกลางเป็นค่าเริ่มต้น ซึ่งเร็วเกินไปสำหรับงานผลิตภัณฑ์หลัก
-
พื้นหลัง — ควรอยู่นิ่ง เลื่อนเล็กน้อย หรือมีส่วนร่วมในฉาก "ฉากหลังขาวอนันต์ ไม่มีการเคลื่อนไหวพื้นหลัง" "พื้นผิวหินอ่อน bokeh เบลอ เปลี่ยนแสงเล็กน้อย" "ความว่างเปล่าของสตูดิโอ ไม่มีรายละเอียดสิ่งแวดล้อม" การละเว้นส่วนนี้มักทำให้เกิดการเลื่อนไหลของพื้นหลังที่ไม่ต้องการ
-
บรรยากาศและอ้างอิงกล้อง — วลีเดียวที่ปรับสอบเทียบโทนทั่วไป การอ้างอิงอุปกรณ์เชื่อถือได้มากกว่าคำคุณศัพท์ "ถ่ายด้วย Fujifilm XT4" ดีกว่า "cinematic" "ความรู้สึกโฆษณาสิ่งพิมพ์หรู" ดีกว่า "high-end" เดือนและเวลาเฉพาะเจาะจง ("เช้าเดือนมกราคม 9 โมงเช้าในสตูดิโอ") ดีกว่า "โกลเดนอาวร์"
เคล็ดลับ
สิ่งที่ควรละเว้น
อย่าใส่ชื่อแบรนด์ ใบหน้าของบุคคล หรือการอ้างอิงถึงสถานที่จริง อย่าเรียงคำพ้องความหมาย ("หรูหรา high-end พรีเมียม") — การใช้ภาษาธรรมชาติของ FLUX.1 ไม่ได้รับประโยชน์จากสิ่งนี้และเพิ่มสัญญาณรบกวน หนึ่งประโยคชัดเจนต่อส่วนดีกว่าคำคุณศัพท์สามคำที่กระจัดกระจาย
เสาหลักที่ 3: ขั้นตอนการทำงานด้านความละเอียดจาก 480p ถึง 720p
ความแตกต่างของค่าเครดิตระหว่าง 480p และ 720p คือ 5 เครดิตต่อวินาที เล็กน้อยสำหรับคลิปเดียว แต่มีนัยสำคัญเมื่อคุณกำลังทำซ้ำ prompt และการเคลื่อนไหวก่อนยืนยัน
ขั้นตอนการทำงานที่แนะนำ
| ขั้นตอน | ความละเอียด | วัตถุประสงค์ | ค่าใช้จ่าย (คลิป 5 วินาที) |
|---|---|---|---|
| 1. การสร้างความคิด prompt | 480p | ทดสอบการเคลื่อนกล้องและความเสถียรของวัตถุ | 50 เครดิต |
| 2. การปรับแต่งการเคลื่อนไหว | 480p | ปรับจังหวะ พื้นหลัง และ prompt แสง | 50 เครดิตต่อการทำซ้ำ |
| 3. ผลลัพธ์สุดท้าย | 720p | ไฟล์หลักที่สะอาดสำหรับโซเชียลหรือ pitch deck | 75 เครดิต |
การทำซ้ำสาม 480p บวกหนึ่งรอบสุดท้าย 720p รวม 225 เครดิต เท่ากับการเรนเดอร์สาม 720p หลักการสำคัญคืออย่าย้ายไป 720p จนกว่าแบบร่าง 480p จะมีการเคลื่อนไหวและองค์ประกอบที่คุณต้องการ เครื่องยนต์ Aurora ปรับขนาดคลิปเดียวกัน ดังนั้นผลลัพธ์ที่ผ่านการตรวจสอบที่ 480p จะกลายเป็นผลลัพธ์ที่ผ่านการตรวจสอบที่ 720p อย่างน่าเชื่อถือ
หมายเหตุ
ตัวอย่างที่ใช้งานได้จริงสี่ชิ้น
ตัวอย่างที่ 1: Hero push ของรองเท้าผ้าใบ
ผลิตภัณฑ์: รองเท้าผ้าใบสีขาวคอต่ำ มุมสี่ส่วนสาม บนโต๊ะสีขาว มีการสะท้อนที่สะอาด
การตั้งค่าภาพต้นฉบับ: ถ่ายจากมุมสูงเล็กน้อยที่ 45 องศา พื้นรองเท้ามองเห็นได้ ปมเชือกคมชัด ป้ายลิ้นรองเท้าอ่านออก ส่งออกที่ 2048 × 2048 ไม่บีบอัด
Prompt:
"dolly เข้าช้าๆ จากระยะกลางสู่ close-up บนกล่องนิ้วเท้า หยุดเมื่อพื้นรองเท้าเต็มหนึ่งในสามของเฟรม เงาแข็งจากแสงธรรมชาติบนที่ปัดจากซ้ายไปขวา จังหวะไม่รีบร้อน 0.3× พื้นหลังสีขาวอนันต์ ไม่มีการเคลื่อนไหว ถ่ายด้วย Leica SL2 รีจิสเตอร์บรรณาธิการรองเท้าหรู"
สิ่งที่การเคลื่อนไหวเพิ่มขึ้น: การ push เข้าอย่างค่อยเป็นค่อยไปเผยให้เห็นพื้นผิวของวัสดุกล่องนิ้วเท้าและขอบพื้นรองเท้าตามลำดับ ซึ่งเป็นข้อมูลที่ภาพนิ่งแบนๆ ไม่สามารถสื่อสารได้ เงาแสงธรรมชาติที่ปัดผ่านแผงด้านข้างแสดงคุณภาพพื้นผิวโดยไม่ต้องใช้เสียงบรรยาย
เสียง: Grok สร้างเสียงห้องแวดล้อมเบาๆ และเสียงวัสดุที่ละเอียดอ่อนเมื่อพื้นรองเท้าเข้ามาในเฟรม ลบออกหรือวางไว้ใต้ดนตรีตามต้องการ
ตัวอย่างที่ 2: การโคจรเผยโฉมนาฬิกา
ผลิตภัณฑ์: นาฬิกาชุดราตรีสเตนเลส วางราบบนกระดาษเนื้อสีเทา หน้าปัดหงายขึ้น สายนาฬิกาคลาย
การตั้งค่าภาพต้นฉบับ: หน้าปัดเต็ม 60% ของเฟรม ตัวเลขอ่านออก รายละเอียดเม็ดมะยมมองเห็นทางขวา ถ่ายที่ 2000 × 2000 แสงกระจายสม่ำเสมอ
Prompt:
"pan โคจรช้าๆ เริ่มต้นที่ตำแหน่ง 9 นาฬิกา เดินตามเข็มนาฬิการอบหน้าปัด ครบ 180 องศาใน 8 วินาที fill จาก softbox จากด้านบน rim specular แข็งจากขวากล้องที่ 4500K ไม่มีการเร่งจังหวะ พื้นผิวผ้าลินินสีเทาอ่อน พื้นหลังนิ่ง สไตล์บรรณาธิการช่างนาฬิกาในสตูดิโอ"
สิ่งที่การเคลื่อนไหวเพิ่มขึ้น: วงโคจรจับแสงโลหะของขอบเรือนนาฬิกาและเข็มจากหลายมุมในรอบเดียว ซึ่งเป็นรายละเอียดผลิตภัณฑ์ที่โดยทั่วไปต้องใช้ภาพนิ่งสี่ภาพแยกกัน โค้ง 180 องศารักษาความสามารถในการอ่านหน้าปัดตลอดเวลา
เสียง: เครื่องยนต์ Aurora สร้างบรรยากาศเชิงกลเบาๆ บาง แม่นยำ เหมาะสมกับบริบทการทำนาฬิกา มีประโยชน์ในฐานะเตียงเสียงใต้เสียงบรรยาย
ตัวอย่างที่ 3: กระเป๋าถือลอยและลงจอด
ผลิตภัณฑ์: กระเป๋าถือหนังโครงสร้างสีน้ำตาลแทน ตั้งตรงหน้าพื้นหลังสีครีมอบอุ่น อุปกรณ์โลหะมองเห็นชัด
การตั้งค่าภาพต้นฉบับ: ด้านหน้าอยู่กึ่งกลางเฟรม ห่วงหูหิ้วด้านบนมองเห็น ตัวดึงซิปคมชัด ถ่ายที่ 1800 × 1800
Prompt:
"กระเป๋าลอยขึ้น 6 ซม. จากพื้นผิว ค้างอยู่ที่จุดสูงสุด 2 วินาที จากนั้นลงจอดเบาๆ แสงแทบไม่เคลื่อน fill แวดล้อมอบอุ่น 3200K จากซ้ายบน แสงสะท้อนหนังเบาๆ จากขวาล่าง จังหวะจงใจ รอบคอบ พื้นหลังครีมอนันต์ ไม่มีการเคลื่อนไหวสิ่งแวดล้อม รีจิสเตอร์แค็ตตาล็อกแฟชั่นหรู ถ่ายด้วย Hasselblad ฟอร์แมตกลาง"
สิ่งที่การเคลื่อนไหวเพิ่มขึ้น: การลอยและลงจอดสร้างความรู้สึกน้ำหนักและความเป็นจริงของวัสดุ กระเป๋าทำตัวเหมือนวัตถุทางกายภาพไม่ใช่ภาพตัดแปะ การหยุดค้างที่จุดสูงสุดให้เวลาผู้ดูอ่านรายละเอียดอุปกรณ์โลหะและการเย็บ
เสียง: โทนห้องเบามาก การลงจอดสร้างเสียงสัมผัสพื้นผิวเบาๆ ที่เน้นความเป็นจริงทางกายภาพ
ตัวอย่างที่ 4: ผลิตภัณฑ์ความงามหมุนพร้อมเอฟเฟกต์หยดน้ำ
ผลิตภัณฑ์: ขวดเซรั่มผิวด้าน ตั้งตรง ฝาหยอดสีเงิน ฉลากสีขาว
การตั้งค่าภาพต้นฉบับ: ขวดเต็ม 55% ของเฟรม ข้อความฉลากคมชัด รายละเอียดฝาปิดมองเห็น พื้นหลังขาวสะอาด ถ่ายที่ 1920 × 1920
Prompt:
"หมุนทวนเข็มนาฬิกาช้าๆ 360 องศาเต็มใน 10 วินาที หยดน้ำละเอียดก่อตัวบนพื้นผิวกระจกเมื่อเริ่มหมุนและกระจายไปเมื่อถึงจุดกึ่งกลาง แสงกลางวันเย็นนุ่มจากด้านบนที่ 6000K rim light จากด้านหลัง จังหวะสม่ำเสมอไม่รีบร้อน พื้นหลังสตูดิโอสีขาว ไม่มีการเลื่อนไหล สุนทรียภาพโฆษณาสกินแคร์ ถ่ายด้วย Phase One IQ4"
สิ่งที่การเคลื่อนไหวเพิ่มขึ้น: เอฟเฟกต์หยดน้ำสื่อสารประสิทธิภาพและความสดชื่น ซึ่งเป็นสองแนวคิดที่แพงในแง่ความคิดสำหรับภาพนิ่ง การหมุน 360 องศาเต็มแสดงข้อความฉลากด้านหลังและกลไกหยอดจากทุกมุม
คำเตือน
โหมดความล้มเหลวทั่วไปและวิธีแก้ไข
| ปัญหา | สาเหตุที่น่าจะเป็น | วิธีแก้ไข |
|---|---|---|
| ข้อความฉลากเบลอหรือบิดเบี้ยวระหว่างการเคลื่อนไหว | ภาพต้นฉบับถูกบีบอัดหรือฉลากเล็กในเฟรม | เริ่มจากต้นฉบับที่ความละเอียดสูงกว่า ครอปให้แน่นกว่าเพื่อให้ฉลากเต็มเฟรมมากขึ้น |
| วัตถุเลื่อนไหลจากตำแหน่งเริ่มต้น | พื้นหลังคล้ายกับผลิตภัณฑ์ทางสายตา | ถ่ายใหม่บนพื้นหลังที่มีความคมชัดสูงกว่า หรืออธิบายสีพื้นหลังใน prompt อย่างชัดเจน |
| การเคลื่อนกล้องเร็วเกินไป | ไม่ได้ระบุจังหวะ | เพิ่มตัวอธิบายจังหวะที่ชัดเจน "ไม่รีบร้อน" "ความรู้สึก 0.3×" หรือการนับวินาที |
| พื้นหลังสร้างการเคลื่อนไหวที่ไม่ต้องการ | ละเว้นคำอธิบายพื้นหลัง | เพิ่ม "พื้นหลังนิ่ง ไม่มีการเคลื่อนไหวพื้นหลัง" อย่างชัดเจน |
| สีเปลี่ยนกลางคลิป | บาลานซ์ขาวในภาพต้นฉบับไม่สม่ำเสมอ | แก้ไขบาลานซ์ขาวของภาพต้นฉบับก่อนอัปโหลด |
| เสียงพื้นฐานฟังดูไม่เหมาะสม | การอ้างอิงบรรยากาศคลุมเครือ | เพิ่มรีจิสเตอร์ที่เฉพาะเจาะจงมากขึ้น ("สตูดิโอเงียบ" "โทนห้องน้อยที่สุด") ถ้าไม่ต้องการ soundscape ที่สร้างขึ้น |
เมื่อใดควรเลือก Grok Imagine 1.5 แทนโมเดลอื่น
Grok Imagine 1.5 เป็นเครื่องมือที่ถูกต้องเมื่อคุณมีภาพนิ่งต้นฉบับที่สะอาดและต้องการการยึดวัตถุที่สม่ำเสมอในอัตราเครดิตที่คุ้มค่า ไม่ใช่เครื่องมือที่ถูกต้องสำหรับทุก brief วิดีโอ
| ความต้องการ | ตัวเลือกที่ดีกว่า |
|---|---|
| ความสม่ำเสมอของตัวละครในฉากหลายช็อต | Seedance 2.0 |
| การกำหนดพารามิเตอร์กล้องระดับเฟรม | V6 |
| ผลลัพธ์ 4K สำหรับออกอากาศ | Veo 3 |
| พลังงานการเคลื่อนไหวสูง ความรู้สึก UGC ไลฟ์สไตล์ | โมเดล PixVerse |
| ความยาวคลิปนานที่สุด (สูงสุด 60 วินาที) | Sora 2 |
สำหรับกรอบการเลือกโมเดลทั่วไปในทั่วทั้งภูมิทัศน์การสร้างวิดีโอจากภาพ คู่มือ ภาพผลิตภัณฑ์สู่โฆษณาวิดีโอ ครอบคลุมตัวเลือกตามเป้าหมายและงบประมาณ
เริ่มต้นใช้งานบน OmniArt
เปิดพื้นที่ทำงานวิดีโอ OmniArt เลือก Grok Imagine เป็นโมเดล และอัปโหลดภาพนิ่งผลิตภัณฑ์ที่ผ่านรายการตรวจสอบภาพต้นฉบับด้านบน เขียน prompt ห้าส่วน ได้แก่ การกระทำ แสง จังหวะ พื้นหลัง บรรยากาศ และสร้างแบบร่าง 5 วินาทีที่ 480p หากการเคลื่อนไหวและการยึดวัตถุยังคงดีอยู่ ให้ย้ายไป 720p สำหรับรอบสุดท้าย
ลูปทั้งหมด ได้แก่ แบบร่าง ปรับแต่ง มาสเตอร์ ทำงานภายในพื้นที่ทำงานเดียวด้วยยอดเครดิตเดียวกันที่คุณใช้กับโมเดล OmniArt อื่นทั้งหมด ไม่ต้องมีบัญชี xAI แยก ไม่ต้องส่งออกไฟล์ไปยังเครื่องมืออื่น ไม่ต้องเริ่มใหม่จากข้อความเมื่อคุณมีภาพผลิตภัณฑ์ที่ต้องการอยู่แล้ว
พร้อมสร้างหรือยัง?
เริ่มสร้างคอนเทนต์ที่ยอดเยี่ยมด้วย AI