Google ได้เปิดตัว Veo 3.1 ซึ่งเป็นการอัปเดตที่สำคัญสำหรับโมเดลการสร้างวิดีโอ AI ที่ปรับปรุงการควบคุมเชิงสร้างสรรค์และความสมจริงสำหรับผู้สร้าง เวอร์ชันใหม่กำลังเปิดตัวในเครื่องมือสร้างภาพยนตร์ AI ของ Google Flow โดยนำเสนอความสามารถในการแก้ไขที่ละเอียดยิ่งขึ้น

ตอนนี้ผู้ใช้สามารถเพิ่มวัตถุลงในฉากและรับประโยชน์จากเสียงที่ละเอียดยิ่งขึ้นและซิงโครไนซ์ผ่านฟีเจอร์ขั้นสูงทั้งหมดของ Flow การอัปเดตซึ่งปรับปรุงการยึดติดและคุณภาพของภาพในทันทีนั้นมีให้บริการในตัวแก้ไข Flow, แอป Gemini และผ่านทาง Gemini API สำหรับนักพัฒนาซอฟต์แวร์.

ความเคลื่อนไหวนี้ส่งสัญญาณถึงความตั้งใจของ Google ที่จะทำให้เครื่องมือเชิงสร้างสรรค์มีประสิทธิภาพและใช้งานง่ายยิ่งขึ้น นับตั้งแต่ Flow เปิดตัวในเดือนพฤษภาคม ผู้ใช้ได้สร้างวิดีโอมากกว่า 275 ล้านวิดีโอ ซึ่งบ่งชี้ถึงความต้องการอย่างมากในการสร้างวิดีโอ AI ที่สามารถเข้าถึงได้ การเปิดตัวครั้งนี้ถือเป็นการเคลื่อนไหวเชิงแข่งขันโดยตรงกับ Sora 2 ของ OpenAI

การควบคุมการสร้างสรรค์ที่ละเอียดยิ่งขึ้นมาถึงใน Flow

ในประกาศ Google วางกรอบการอัปเดตว่าเป็นการตอบสนองโดยตรงต่อความคิดเห็นของครีเอเตอร์เกี่ยวกับเครื่องมือหลังยุคที่มีความซับซ้อนมากขึ้น

ตามข้อมูลของผู้นำผลิตภัณฑ์ Jess Gallegos และ Thomas Iljic”เรารับฟังความคิดเห็นของคุณอยู่เสมอ และเรารับฟังเสมอ ว่าคุณต้องการการควบคุมเชิงศิลปะมากขึ้นภายใน Flow พร้อมการสนับสนุนเสียงที่เพิ่มขึ้นในทุกฟีเจอร์”

การมุ่งเน้นไปที่การทำซ้ำที่ขับเคลื่อนโดยผู้ใช้นี้ถือเป็นการเปลี่ยนแปลงเชิงกลยุทธ์ โดยย้าย Flow จากกลไกการสร้างบริสุทธิ์ไปสู่ชุดครีเอทีฟโฆษณาที่ครอบคลุมและโต้ตอบได้มากขึ้น

หัวใจสำคัญของความพยายามนี้คือชุดเครื่องมือแก้ไขใหม่ภายในตัวแก้ไข Flow ที่ออกแบบมาเพื่อช่วงเวลาที่การถ่ายภาพครั้งแรกไม่ใช่ครั้งสุดท้าย

[เนื้อหาที่ฝัง]

ส่วนเพิ่มเติมที่โดดเด่นที่สุดคือฟีเจอร์”แทรก”ซึ่งช่วยให้ผู้สร้างสามารถเพิ่มองค์ประกอบใหม่ๆ ตั้งแต่รายละเอียดที่ละเอียดอ่อนและสมจริงไปจนถึงสิ่งมีชีวิตที่น่าอัศจรรย์ทั้งหมด ลงในคลิปวิดีโอที่สร้างไว้แล้ว

ได้รับการออกแบบทางวิศวกรรมเพื่อให้ผู้ใช้สามารถจินตนาการใหม่และทำให้ฉากของตนสมบูรณ์แบบได้โดยตรงภายในแอปพลิเคชัน ซึ่งช่วยลดความจำเป็นในการใช้ซอฟต์แวร์ตัดต่อภายนอกสำหรับการปรับแต่งและเพิ่มเติมเล็กน้อย

ตามข้อมูลของ Google ความซับซ้อนของโมเดลช่วยให้มั่นใจว่าส่วนเพิ่มเติมเหล่านี้ดูเป็นธรรมชาติและเหมาะสมตามบริบท Veo 3.1 วิเคราะห์ฉากที่มีอยู่อย่างชาญฉลาดเพื่อจัดการกับรายละเอียดที่ซับซ้อน เช่น เงาและแสงโดยรอบ เพื่อให้มั่นใจว่าวัตถุใหม่นั้นอยู่ในสภาพแวดล้อม

นอกจากนี้ โมเดลยังทำงานเพื่อผสมผสานองค์ประกอบที่แทรกเข้ากับสไตล์ศิลปะที่สร้างขึ้นของคลิป ความสามารถนี้ก้าวไปไกลกว่าการวางวัตถุแบบธรรมดา โดยเสนอวิธีการแบบไดนามิกและสอดคล้องกันมากขึ้นในการปรับแต่งเนื้อหาที่สร้างโดย AI

เพื่อเสริมความสามารถใหม่นี้ Google ยังได้ประกาศด้วยว่าฟีเจอร์”ลบ”ที่เกี่ยวข้องจะ”ใช้งานได้เร็วๆ นี้”ในโปรแกรมแก้ไข Flow

โดยจะช่วยให้ผู้ใช้นำวัตถุหรือตัวละครที่ไม่ต้องการออกจากฉากได้อย่างราบรื่น บริษัทอธิบายว่า Flow จะสร้างพื้นหลังและสภาพแวดล้อมขึ้นใหม่โดยอัตโนมัติ ทำให้ดูเหมือนวัตถุไม่เคยอยู่ที่นั่น

ฟีเจอร์เหล่านี้ร่วมกันแสดงถึงก้าวสำคัญในการมอบชุดเครื่องมือในการลงสีและลงสีที่สมบูรณ์แบบสำหรับวิดีโอ AI

จากคลิปเงียบไปจนถึงการเล่าเรื่องด้วยเสียง

จุดสนใจหลักของการเปิดตัว Veo 3.1 คือการขยายเสียง ความสามารถ การอัปเดตนี้สร้างจากรากฐานของ Veo 3 ซึ่งเป็นโมเดลแรกของ Google ที่ผสานรวมเสียง โดยนำการสร้างเสียงมาสู่ฟังก์ชันสร้างสรรค์ขั้นสูงสุดของ Flow

การปรับปรุงนี้แก้ไขข้อจำกัดที่สำคัญของเครื่องมือวิดีโอ AI รุ่นก่อนๆ ดังที่ Demis Hassabis CEO ของ Google DeepMind ได้ประกาศไว้ก่อนหน้านี้ว่า”เรากำลังก้าวออกมาจากยุคแห่งความเงียบงันแห่งการสร้างวิดีโอ”การอัปเดตนี้เป็นขั้นตอนสำคัญในการเติมเต็มวิสัยทัศน์ โดยการเพิ่มบทสนทนา เอฟเฟกต์เสียง และเสียงรบกวนรอบข้าง

การมุ่งเน้นไปที่ความสมจริงเป็นสิ่งสำคัญสำหรับการผลิตเนื้อหาที่น่าเชื่อถือและน่าดึงดูดโดยไม่ต้องมีงานหลังการผลิตที่ครอบคลุม

ตอนนี้ผู้สร้างสามารถสร้างเสียงที่เข้มข้นและซิงโครไนซ์ได้ เมื่อใช้ฟีเจอร์ เช่น”ส่วนผสมของวิดีโอ”ซึ่งใช้รูปภาพอ้างอิงเพื่อควบคุมตัวละครและสไตล์ เครื่องมือ”Frames to Video”สำหรับการสร้างการเปลี่ยนภาพระหว่างสองภาพ ขณะนี้ยังมีเสียงอยู่ด้วย

[เนื้อหาที่ฝังไว้]

คุณลักษณะ”ขยาย”ที่ใช้ในการสร้างช็อตที่ยาวขึ้นและต่อเนื่อง จะสร้างภาพเสียงประกอบด้วย ทำให้มีประโยชน์มากขึ้นสำหรับการสร้างช็อตและลำดับการเล่าเรื่องที่ยาวขึ้น

การเปิดตัวเชิงกลยุทธ์ในการแข่งขันวิดีโอ AI

Google ปรับใช้ Veo 3.1 ทั่วทั้งชุดผลิตภัณฑ์ AI เพื่อเพิ่มการเข้าถึงสูงสุด นอกเหนือจากตัวแก้ไข Flow และแอป Gemini ที่เข้าถึงผู้บริโภคได้แล้ว ขณะนี้โมเดลนี้พร้อมใช้งานสำหรับนักพัฒนาและลูกค้าองค์กรแล้ว

นักพัฒนาสามารถเข้าถึง Veo 3.1 และฟีเจอร์ใหม่ๆ ของมันได้ผ่าน ตัวอย่างแบบชำระเงินใน Gemini API ช่วยให้พวกเขา รวมความสามารถในการสร้างวิดีโออันทรงพลังเข้ากับแอปพลิเคชันของตนเอง ลูกค้าระดับองค์กรสามารถใช้ประโยชน์จากโมเดลนี้ได้ผ่าน Vertex AI

กลยุทธ์การจัดจำหน่ายแบบหลายด้านนี้แสดงให้เห็นถึงความทะเยอทะยานของ Google ที่จะแข่งขันในด้าน AI ที่พัฒนาอย่างรวดเร็ว วิดีโอ การเปิดตัวดังกล่าวเกิดขึ้นไม่นานหลังจากการเปิดตัวแอป Sora 2 ของ OpenAI ที่เป็นที่ถกเถียงกัน ซึ่งเผชิญกับกระแสตอบโต้ทันทีเกี่ยวกับข้อกังวลด้านลิขสิทธิ์และการปลอมแปลงอย่างล้ำลึก

ในทางตรงกันข้าม Google ยังคงเน้นย้ำถึงความมุ่งมั่นต่อ AI ที่มีความรับผิดชอบ โดยฝังลายน้ำ SynthID ไว้ในเนื้อหาที่สร้างขึ้นทั้งหมด กลยุทธ์นี้ดูเหมือนจะได้รับการคำนวณเพื่อวางตำแหน่ง Veo ให้เป็นทางเลือกที่มีเสถียรภาพมากขึ้นและพร้อมสำหรับองค์กร

การอัปเดตยังตอกย้ำกลยุทธ์การสมัครรับข้อมูลแบบสองชั้นที่ชัดเจนของ Google โดยเพิ่มมูลค่าที่จับต้องได้ให้กับแผน AI Pro และ AI Ultra เพื่อส่งเสริมการนำไปใช้และสร้างฐานผู้ใช้ที่ภักดี

การกำหนดอนาคตของการสร้างภาพยนตร์ด้วย AI

วิวัฒนาการอย่างรวดเร็วของการสร้างภาพยนตร์ เครื่องมือวิดีโอคาดว่าจะเปลี่ยนอุตสาหกรรมสร้างสรรค์ การแนะนำการควบคุมการแก้ไขที่ละเอียดและเสียงแบบบูรณาการใน Veo 3.1 ช่วยลดอุปสรรคทางเทคนิคสำหรับการผลิตวิดีโอคุณภาพสูง ช่วยให้นักเล่าเรื่องสามารถทำซ้ำแนวคิดได้รวดเร็วยิ่งขึ้น

เมื่อแพลตฟอร์มเหล่านี้เติบโตเต็มที่ พวกเขาก็เริ่มมีความแปลกใหม่น้อยลงและกลายเป็นส่วนสำคัญของขั้นตอนการทำงานที่สร้างสรรค์มากขึ้น ตั้งแต่การเขียนเรื่องราวไปจนถึงการผลิตขั้นสุดท้าย จุดมุ่งเน้นคือการเปลี่ยนจากเอาต์พุตข้อความเป็นวิดีโอธรรมดาไปเป็นกระบวนการที่มีการโต้ตอบและทำงานร่วมกันมากขึ้นระหว่างผู้สร้างที่เป็นมนุษย์และโมเดล AI

Categories: IT Info