Shutterstock ได้เปิดตัวโมเดลการออกใบอนุญาตตามหลักจริยธรรมที่ออกแบบมาเพื่อปรับโฉมวิธีที่นักพัฒนา AI เข้าถึงข้อมูลการฝึกอบรมคุณภาพสูง
ใบอนุญาตการวิจัยใหม่ของ Shutterstock ช่วยให้สตาร์ทอัพ AI และนักพัฒนารายย่อยสามารถฝึกอบรมระบบ AI ได้ในราคาประหยัดและมีความรับผิดชอบ แอปพลิเคชันแรก กำลังขับเคลื่อน LTXV (วิดีโอ LTX) ซึ่งเป็นโมเดลการสร้างวิดีโอแบบเรียลไทม์ที่พัฒนาโดย ไลท์ริกส์.
ด้วยการใช้คลังวิดีโอ HD และ 4K ที่มีอยู่มากมายของ Shutterstock Lightricks ตั้งเป้าที่จะเอาชนะอุปสรรคทางเทคนิคในการผลิตวิดีโอ AI ในขณะเดียวกันก็ยึดมั่นในมาตรฐานทางจริยธรรม ด้วยคลังภาพขนาดใหญ่กว่า 800 ล้านภาพและคลิปวิดีโอ 55 ล้านคลิป ปัจจุบัน Shutterstock ให้บริการลูกค้าที่ใช้งานอยู่ประมาณ 4.1 ล้านราย
“บริษัทและผู้ฝึกสอนโมเดลจำนวนมากได้ใช้เส้นทางของการขูดข้อมูลที่ไม่ได้รับอนุญาต [แทนที่จะ] ทำการลงทุนที่จำเป็นเพื่อให้ได้คุณภาพและระดับความไว้วางใจที่จำเป็น เพื่อพัฒนาโมเดลที่ใช้งานได้ในเชิงพาณิชย์”Daniel Mandell หัวหน้าฝ่ายลิขสิทธิ์ข้อมูลระดับโลกของ Shutterstock กล่าว AI
“อย่างไรก็ตาม เราไม่คิดว่าการลงทุนทางการเงินควรเป็นอุปสรรคสำหรับผู้ที่ต้องการเข้าสู่พื้นที่นี้ด้วยแนวทางที่มีจริยธรรม”
เกี่ยวข้อง
strong>: OpenAI เปิดตัว Sora AI Video Generator ให้กับสมาชิก ChatGPT Plus และ Pro
ใบอนุญาตการวิจัยของ Shutterstock: โมเดลการออกใบอนุญาตแบบสองเฟส
แนะนำใบอนุญาตการวิจัยของ Shutterstock กรอบการออกใบอนุญาตแบบสองเฟสมุ่งเป้าไปที่การจัดการต้นทุนต้องห้ามที่เกี่ยวข้องกับการฝึกอบรม AI ในระยะเริ่มแรก นักพัฒนาสามารถทดลองกับชุดข้อมูลขนาดเล็กเพื่อการทดสอบและการตรวจสอบความถูกต้อง
เมื่อโครงการพร้อมสำหรับการดำเนินการเชิงพาณิชย์ พวกเขาสามารถเปลี่ยนไปใช้ใบอนุญาตเชิงพาณิชย์เต็มรูปแบบได้ แนวทางที่ยืดหยุ่นนี้ได้รับการออกแบบมาเพื่อลดอุปสรรคทางการเงินในการเข้าสู่ธุรกิจสตาร์ทอัพและองค์กรขนาดเล็ก
Mandell เน้นย้ำว่า Shutterstock มีเป้าหมายเพื่อสร้างมาตรฐานทางจริยธรรมในการพัฒนา AI และรับประกันค่าตอบแทนที่ยุติธรรมสำหรับผู้สร้างเนื้อหา
หนึ่งในความท้าทายที่เกิดขึ้นอย่างต่อเนื่องที่สุดในการสร้างวิดีโอ AI คือการรักษาการเคลื่อนไหวที่ราบรื่นและต่อเนื่องกันในเฟรมต่างๆ โดยเฉพาะในคลิปที่ยาวขึ้น สถาปัตยกรรมของ LTXV ได้รับการออกแบบมาโดยเฉพาะเพื่อแก้ไขปัญหานี้ ด้วยการฝึกอบรมชุดข้อมูลวิดีโอที่หลากหลายและมีคุณภาพสูงของ Shutterstock LTXV บรรลุระดับความสม่ำเสมอของการเคลื่อนไหวซึ่งทำให้แตกต่างจากโมเดลคู่แข่ง
“ข้อมูลของ Shutterstock ช่วยให้เราสามารถฝึกอบรมโมเดลอย่างมีความรับผิดชอบและมีจริยธรรม” Zeev Farbman กล่าว , CEO ของ Lightricks “ความร่วมมือครั้งนี้ทำให้มั่นใจได้ว่าเราเคารพสิทธิ์ในการสร้างสรรค์ในขณะที่ขับเคลื่อนความสามารถทางเทคนิคของเครื่องมือของเรา”
ที่เกี่ยวข้อง: Meta เปิดตัววิดีโอ ปิดผนึกกรอบงานสำหรับลายน้ำวิดีโอ AI ที่ซ่อนอยู่
การชดเชยที่ยุติธรรมสำหรับผู้ร่วมให้ข้อมูล
ผู้ร่วมให้ข้อมูลในแพลตฟอร์มของ Shutterstock ได้รับประโยชน์จากรูปแบบการแบ่งรายได้ โดยได้รับ 20% ของรายได้ สร้างขึ้นจากข้อตกลงสิทธิ์การใช้งานข้อมูล นอกจากนี้ ผู้สร้างเนื้อหาสามารถเลือกไม่ให้ใช้งานผลงานของตนเพื่อวัตถุประสงค์ในการฝึกอบรม AI ซึ่งเป็นตัวเลือกที่ใช้โดยผู้ร่วมให้ข้อมูลของ Shutterstock น้อยกว่า 1%
Mandell ถือว่าอัตราการไม่เข้าร่วมที่ต่ำนี้เนื่องมาจากความโปร่งใสและความยุติธรรมของรูปแบบใบอนุญาต
ความคิดริเริ่มนี้ทำให้ Shutterstock เป็นตัวขับเคลื่อนในการส่งเสริมหลักปฏิบัติด้านจริยธรรมของ AI ในช่วงเวลาที่อุตสาหกรรม เผชิญกับการตรวจสอบที่เพิ่มมากขึ้นเกี่ยวกับการจัดหาข้อมูล มีการฟ้องร้องหลายคดีต่อบริษัท AI ที่ถูกกล่าวหาว่าใช้เนื้อหาที่มีลิขสิทธิ์ในชุดข้อมูลการฝึกอบรมโดยไม่ได้รับอนุญาต
ที่เกี่ยวข้อง: Amazon เปิดตัวโมเดล Nova Multimodal AI สำหรับข้อความ รูปภาพ และวิดีโอ
ความสามารถของ LTXV: การสร้างวิดีโอ AI แบบเรียลไทม์
LTXV พัฒนาโดย Lightricks สามารถสร้างวิดีโอได้เร็วกว่าความเร็วในการเล่น โดยสร้าง 24 เฟรมต่อวินาที และ ให้ความละเอียดสูง วิดีโอในเวลาเพียง 30 วินาทีบนฮาร์ดแวร์ระดับไฮเอนด์
LTXV มีโหมดการทำงานที่หลากหลาย รวมถึงข้อความ-การสร้างเป็นวิดีโอ, รูปภาพเป็นวิดีโอ และการสร้างวิดีโอเป็นวิดีโอ คุณสมบัติเหล่านี้ช่วยให้ผู้สร้างสามารถสร้างภาพเคลื่อนไหว แปลงฟุตเทจที่มีอยู่ หรือสร้างวิดีโอใหม่ทั้งหมดโดยอิงตามคำอธิบายที่พร้อมท์ ความยืดหยุ่นของเครื่องมือเหล่านี้ทำให้ LTXV เข้าถึงได้ทั้งผู้สร้างภาพยนตร์มืออาชีพและผู้สร้างอิสระ
รูปภาพ: lightricks/LTXV
นวัตกรรมทางเทคนิค
โมเดลนี้สร้างขึ้นบนสถาปัตยกรรม Diffusion Transformer (DiT) พร้อมด้วยพารามิเตอร์ 2 พันล้านพารามิเตอร์ ซึ่งช่วยให้เกิดการเปลี่ยนผ่านระหว่างเฟรมได้อย่างราบรื่น และรักษาความสม่ำเสมอบนคลิปที่ขยายออก
ความละเอียดเอาต์พุตเริ่มต้นของ LTXV คือ 768×512 แต่สามารถขยายได้ถึง 720×1280 ในขณะที่ยังคงประสิทธิภาพไว้ ต่างจากโมเดล AI หลายๆ รุ่นซึ่งต้องใช้โครงสร้างพื้นฐานอันทรงพลัง LTXV สามารถทำงานได้อย่างมีประสิทธิภาพบน GPU ระดับผู้บริโภคที่มี VRAM เพียง 6GB ทำให้ขยายการเข้าถึงไปยังสตูดิโอขนาดเล็กและนักพัฒนาแต่ละรายได้กว้างขึ้น
ที่เกี่ยวข้อง: Google Vertex AI นำเสนอ Veo AI Video Generator และ Imagen 3 Text-to-Image Model
Craig Andrews ผู้จัดการฝ่ายประชาสัมพันธ์ระดับโลกของ Lightricks กล่าวว่าความสม่ำเสมอของการเคลื่อนไหวเป็นหนึ่งในความท้าทายทางเทคนิคที่ใหญ่ที่สุดใน การสร้างวิดีโอ AI และอธิบายว่าไลบรารีวิดีโอของ Shutterstock มีบทบาทสำคัญในการแก้ไขปัญหานี้
รูปภาพ: lightricks/LTXV
LTXV เปิดตัวภายใต้ Apache 2.0 ใบอนุญาต ทำให้สามารถแก้ไข ใช้งาน และแจกจ่ายซ้ำได้อย่างอิสระ กรอบงานโอเพ่นซอร์สนี้สนับสนุนการทำงานร่วมกันระหว่างนักพัฒนาและนักวิจัย ในขณะเดียวกันก็รับประกันการเข้าถึงสำหรับผู้สร้างอิสระและธุรกิจขนาดเล็ก โมเดลดังกล่าวโฮสต์บน GitHub และ Hugging Face ซึ่งมีการดาวน์โหลดไปแล้วหลายพันครั้ง
นอกเหนือจากความพร้อมใช้งานแบบโอเพ่นซอร์สแล้ว LTXV ยังทำงานร่วมกับแพลตฟอร์ม เช่น ComfyUI ทำให้ผู้ใช้สามารถปรับแต่งและปรับใช้คุณลักษณะต่างๆ ตามความต้องการเฉพาะได้ ความยืดหยุ่นในระดับนี้ทำให้ LTXV เป็นเครื่องมือที่มีคุณค่าสำหรับทั้งผู้เชี่ยวชาญด้านเทคนิคและผู้เชี่ยวชาญด้านการสร้างสรรค์
ที่เกี่ยวข้อง: Adobe เปิดตัวเครื่องมือวิดีโอ AI ใน Premiere Pro และขยาย Firefly
ความสามารถของ LTXV ในการสร้างคลิปแบบขยายที่มีคุณภาพสม่ำเสมอ ทำให้สามารถปรับขนาดได้สูงสำหรับการใช้งานต่างๆ ตั้งแต่อีคอมเมิร์ซเชิงโต้ตอบและการโฆษณาไปจนถึงการพัฒนาเกมและการสร้างเนื้อหา ความอเนกประสงค์ของโมเดลนี้จะเปิดโอกาสใหม่ๆ ให้กับผู้สร้าง ความเข้ากันได้กับ GPU ระดับผู้บริโภคช่วยขยายความน่าดึงดูดยิ่งขึ้น ทำให้มั่นใจได้ว่าแม้แต่สตูดิโอขนาดเล็กก็สามารถควบคุมความสามารถของมันได้
กรอบงานการออกใบอนุญาตของ Shutterstock มอบทางเลือกที่เป็นไปตามข้อกำหนดซึ่งเป็นประโยชน์ต่อทั้งนักพัฒนาและผู้สร้างเนื้อหา ด้วยการใช้ประโยชน์จากชุดข้อมูลที่มาจากจริยธรรมของ Shutterstock LTXV เป็นตัวอย่างว่านวัตกรรมโอเพ่นซอร์สสามารถสอดคล้องกับหลักปฏิบัติด้านจริยธรรมได้อย่างไร