Google ได้เปิดตัวโมเดลการสร้างสื่อ AI ล่าสุด ได้แก่ Veo และ Imagen 3 ที่ Google I/O 2024 Veo ได้รับการออกแบบมาเพื่อผลิตวิดีโอคุณภาพสูง 1080p ในขณะที่ Imagen 3 เป็นเฟรมเวิร์กการแปลงข้อความเป็นรูปภาพใหม่ล่าสุดของบริษัท โมเดลเหล่านี้มีเป้าหมายที่จะแข่งขันกับโมเดลวิดีโอ Sora ของ OpenAI และ Dall-E 3 ซึ่งได้รับการโดดเด่นในสื่อที่สร้างโดย AI
ความสามารถขั้นสูงของ Veo
Veo ตามข้อมูลของ Google มีความเข้าใจขั้นสูงเกี่ยวกับภาษาธรรมชาติและความหมายของภาพ ทำให้สามารถสร้างวิดีโอที่มีความยาวมากกว่าหนึ่งนาทีได้ AI สามารถเข้าใจเทคนิคด้านภาพยนตร์ เช่น ไทม์แลปส์ และจำลองฟิสิกส์ในโลกแห่งความเป็นจริงได้ Veo สามารถสร้างวิดีโอจากข้อความ รูปภาพ และวิดีโอ ทำให้สามารถสร้างสรรค์ผลงานได้อย่างหลากหลาย Demis Hassabis ซีอีโอของ Google DeepMind กล่าวว่าผลลัพธ์วิดีโอสามารถปรับแต่งได้โดยใช้ข้อความแจ้งเพิ่มเติม ซึ่งช่วยปรับปรุงกระบวนการสร้างสรรค์
เพื่อแสดงให้เห็นถึงความสามารถของ Veo Google ได้ร่วมมือกับ Donald Glover และสตูดิโอสร้างสรรค์ของเขา Gilga ในวิดีโอโปรโมต Glover และทีมของเขาใช้ข้อความเพื่อสร้างฉากต่างๆ เช่น รถเปิดประทุนมาถึงบ้านของชาวยุโรปและเรือใบแล่นไปในมหาสมุทร Glover เน้นย้ำว่าแกนหลักของเครื่องมือเหล่านี้คือการเล่าเรื่อง ซึ่งแนะนำว่าทุกคนสามารถเป็นผู้กำกับได้ด้วยเทคโนโลยีดังกล่าว
[เนื้อหาที่ฝัง]
อนาคตของ Veo ในการสร้างเนื้อหา
Google กำลังสำรวจคุณสมบัติเพิ่มเติมเพื่อให้ Veo สามารถสร้างสตอรี่บอร์ดและฉากที่ยาวขึ้นได้ บริษัทขอเชิญชวนผู้สร้างภาพยนตร์และผู้สร้างสรรค์ที่ได้รับเลือกให้ทดลองใช้โมเดลนี้เพื่อดูว่าจะสามารถรองรับครีเอทีฟโฆษณาได้ดีที่สุดอย่างไร คุณสมบัติ Veo บางอย่างจะมีให้สำหรับผู้สร้างที่ได้รับเลือกในการดูตัวอย่างส่วนตัวภายใน VideoFX Google วางแผนที่จะเพิ่มความสามารถบางอย่างของ Veo ลงใน YouTube Shorts ในอนาคต
Imagen 3 ปรับปรุงการสร้างข้อความเป็นภาพ
Imagen 3 ซึ่งเป็นเวอร์ชันล่าสุดของ Google โมเดลข้อความเป็นรูปภาพรับประกันคุณภาพที่สูงขึ้นและภาพเสมือนจริงที่มีรายละเอียดมากขึ้นโดยมีข้อผิดพลาดน้อยลง Google ยืนยันว่า Imagen 3 จัดการข้อความได้อย่างมีประสิทธิภาพมากกว่ารุ่นก่อนและสามารถจัดการรายละเอียดที่ซับซ้อนได้จากข้อความแจ้งที่ขยายออกไป โมเดลนี้คาดว่าจะเป็นคู่แข่งที่แข็งแกร่งของ Dall-E 3 ของ OpenAI ซึ่งมีชื่อเสียงในด้านความสามารถในการสร้างภาพด้วย AI
Music AI Sandbox สำหรับศิลปินผู้บันทึกเสียง
นอกเหนือจาก Veo และ Imagen 3 แล้ว Google ยังได้เปิดตัว Music AI Sandbox ซึ่งเป็นชุดเครื่องมือที่มุ่งเป้าไปที่การบันทึกศิลปินเพื่อช่วยในการสร้างเพลงและจังหวะ ศิลปินอย่าง Wyclef Jean และ Bjorn ร่วมมือกับ Google เพื่อทดสอบเครื่องมือเหล่านี้ Music AI Sandbox ได้ทำการสาธิตที่น่าสนใจแล้ว แม้ว่ารายละเอียดเฉพาะจะมีจำกัด
[เนื้อหาที่ฝังไว้]
เครื่องมือ AI ใหม่ของ Google สะท้อนให้เห็นถึงการลงทุนจำนวนมากของบริษัทในด้านเทคโนโลยี AI โดยมีเป้าหมายที่จะเป็นผู้นำ ความก้าวหน้าครั้งสำคัญครั้งต่อไปในด้านคอมพิวเตอร์ ขณะนี้ Veo มีให้บริการภายใน เครื่องมือ VideoFX ของ Google สำหรับผู้สร้างที่ได้รับเลือก และจะรวมเข้ากับ YouTube Shorts และผลิตภัณฑ์อื่นๆ เร็วๆ นี้ ในช่วงไม่กี่ปีที่ผ่านมา Google ได้ผลิตโมเดลการสร้างวิดีโอหลายรูปแบบ รวมถึง Phenaki, Imagen Video และ Lumiere
การแข่งขันกับ OpenAI
OpenAI กำลังนำเสนออยู่แล้ว เครื่องกำเนิดวิดีโอ AI ของตัวเอง Sora ไปยังฮอลลีวูด และวางแผนที่จะเผยแพร่สู่สาธารณะในปลายปีนี้ OpenAI อาจทำให้โมเดล Sora พร้อมใช้งานโดยตรงภายในแอปพลิเคชันตัดต่อวิดีโอ เช่น Adobe Premiere Pro ภาพรวมการแข่งขันนี้ตอกย้ำถึงวิวัฒนาการที่รวดเร็วและความสำคัญที่เพิ่มขึ้นของ AI ในการสร้างสื่อ