Shutterstock hat ein ethisches Lizenzmodell vorgestellt, das die Art und Weise, wie KI-Entwickler auf hochwertige Trainingsdaten zugreifen, neu gestalten soll.
Die neue Forschungslizenz von Shutterstock ermöglicht es KI-Startups und kleineren Entwicklern, KI-Systeme kostengünstig und verantwortungsvoll zu trainieren. Seine erste Anwendung treibt LTXV (LTX Video) an, ein Echtzeit-Videogenerierungsmodell, das von Lightricks.
Durch die Nutzung der umfangreichen HD-und 4K-Videobibliothek von Shutterstock möchte Lightricks technische Barrieren bei der KI-Videoproduktion überwinden und gleichzeitig ethische Standards einhalten. Mit einer riesigen Bibliothek von über 800 Millionen Bildern und 55 Millionen Videoclips bedient Shutterstock derzeit rund 4,1 Millionen aktive Kunden
„Viele Unternehmen und Modelltrainer haben den Weg des unbefugten Daten-Scrapings eingeschlagen, [anstatt] die notwendigen Investitionen zu tätigen, um die erforderliche Qualität und das erforderliche Maß an Vertrauen zu erreichen.“ um kommerziell realisierbare Modelle zu entwickeln“, sagte Daniel Mandell, weltweiter Leiter für Datenlizenzierung und Datenlizenzierung bei Shutterstock KI.
„Wir glauben jedoch nicht, dass finanzielle Investitionen ein Hindernis für diejenigen darstellen sollten, die mit einem ethischen Ansatz in diesen Bereich einsteigen möchten.“
Verwandt: OpenAI veröffentlicht Sora AI Video Generator für ChatGPT Plus-und Pro-Abonnenten
Shutterstocks Forschungslizenz: Ein zweiphasiges Lizenzmodell
Shutterstocks Forschungslizenz stellt vor A Zweistufiger Lizenzierungsrahmen, der darauf abzielt, die unerschwinglichen Kosten im Zusammenhang mit der KI-Schulung zu bewältigen. In der Anfangsphase können Entwickler zum Testen und zur Validierung mit kleineren Datensätzen experimentieren.
Sobald ihre Projekte zur Kommerzialisierung bereit sind, können sie auf vollständige kommerzielle Lizenzen umsteigen. Dieser flexible Ansatz soll die finanziellen Eintrittsbarrieren für Startups und kleinere Organisationen senken.
Mandell betonte, dass Shutterstock darauf abzielte, ethische Standards in der KI-Entwicklung zu etablieren und eine faire Vergütung für Content-Ersteller sicherzustellen.
Eine der hartnäckigsten Herausforderungen bei der KI-Videogenerierung ist die Aufrechterhaltung einer reibungslosen, kohärenten Bewegung über alle Frames hinweg, insbesondere in längeren Clips. Die Architektur von LTXV ist speziell auf die Lösung dieses Problems ausgelegt. Durch das Training mit den vielfältigen und hochwertigen Videodatensätzen von Shutterstock erreicht LTXV ein Maß an Bewegungskonsistenz, das es von konkurrierenden Modellen unterscheidet.
„Die Daten von Shutterstock ermöglichen es uns, Modelle verantwortungsbewusst und ethisch zu trainieren“, sagte Zeev Farbman , CEO von Lightricks. „Diese Partnerschaft stellt sicher, dass wir kreative Rechte respektieren und gleichzeitig die technischen Fähigkeiten unserer Tools vorantreiben.“
Verwandt: Meta stellt Video Seal Framework für versteckte KI-Videos vor Wasserzeichen
Gerechte Vergütung für Mitwirkende
Mitwirkende der Plattform von Shutterstock profitieren von einem Umsatzbeteiligungsmodell und erhalten 20 % der Einnahmen aus Datenlizenzvereinbarungen. Darüber hinaus können Inhaltsersteller die Verwendung ihrer Arbeit für KI-Schulungszwecke ablehnen, eine Entscheidung, die von weniger als 1 % der Shutterstock-Mitwirkenden getroffen wird.
Mandell führt diese niedrige Opt-out-Rate auf die Transparenz und Fairness des Lizenzmodells zurück.
Die Initiative positioniert Shutterstock als Treiber für die Förderung ethischer KI-Praktiken in einer Zeit, in der die Branche steht bei der Datenbeschaffung zunehmend unter Druck. Es wurden mehrere Klagen gegen KI-Unternehmen eingereicht, denen vorgeworfen wird, in ihren Trainingsdatensätzen ohne Genehmigung urheberrechtlich geschütztes Material verwendet zu haben.
Verwandt: Amazon stellt Nova multimodale KI-Modelle für Text, Bilder und Videos vor
Funktionen von LTXV: KI-Videogenerierung in Echtzeit
LTXV, entwickelt von Lightricks, kann Videos schneller als die Wiedergabegeschwindigkeit produzieren und 24 Bilder pro Sekunde erzeugen liefern hochauflösende Videos in nur 30 Sekunden auf High-End-Hardware.
LTXV bietet mehrere Betriebsmodi, einschließlich Text-zu-Video-, Bild-zu-Video-und Video-zu-Video-Generierung. Mit diesen Funktionen können Ersteller Animationen erstellen, vorhandenes Filmmaterial umwandeln oder auf der Grundlage beschreibender Eingabeaufforderungen völlig neue Videos erstellen. Die Flexibilität dieser Tools macht LTXV sowohl für professionelle Filmemacher als auch für unabhängige Urheber zugänglich.
Bild: lightricks/LTXV
Technische Innovationen
Das Modell basiert auf einer Diffusion Transformer (DiT)-Architektur mit zwei Milliarden Parametern, die es ermöglicht, reibungslose Übergänge zwischen Frames zu erreichen und die Konsistenz über längere Clips hinweg aufrechtzuerhalten.
Die Standardausgabeauflösung von LTXV beträgt 768 x 512, sie kann jedoch bei Beibehaltung der Leistung auf 720 x 1280 skaliert werden. Im Gegensatz zu vielen KI-Modellen, die eine leistungsstarke Infrastruktur erfordern, kann LTXV effizient auf Verbraucher-GPUs mit nur 6 GB VRAM betrieben werden, wodurch seine Zugänglichkeit auf kleinere Studios und einzelne Entwickler ausgeweitet wird.
Verwandt: Google Vertex AI bietet jetzt Veo AI Video Generator und Imagen 3 Text-to-Image-Modell
Craig Andrews, globaler PR-Manager bei Lightricks, erklärte, dass Bewegungskonsistenz eine der größten technischen Herausforderungen in der KI sei Videogenerierung und erklärte, dass die Videobibliothek von Shutterstock eine wesentliche Rolle bei der Lösung dieses Problems gespielt hat.
Bild: lightricks/LTXV
LTXV wird unter Apache 2.0 veröffentlicht Lizenz, wodurch es zur Änderung, Nutzung und Weiterverbreitung frei verfügbar gemacht wird. Dieses Open-Source-Framework fördert die Zusammenarbeit zwischen Entwicklern und Forschern und gewährleistet gleichzeitig die Zugänglichkeit für unabhängige Entwickler und kleine Unternehmen. Das Modell wird auf GitHub und Hugging Face gehostet, wo es bereits tausende Male heruntergeladen wurde.
Zusätzlich zu seiner Open-Source-Verfügbarkeit lässt sich LTXV in Plattformen wie ComfyUI, sodass Benutzer die Funktionen individuell anpassen und an spezifische Bedürfnisse anpassen können. Dieses Maß an Flexibilität macht LTXV zu einem wertvollen Werkzeug sowohl für technische Experten als auch für Kreativprofis.
Verwandt: Adobe stellt KI-Videotools in Premiere Pro vor und erweitert Firefly
Die Fähigkeit von LTXV, erweiterte Clips mit gleichbleibender Qualität zu generieren, macht es für verschiedene Anwendungen hoch skalierbar. Von interaktivem E-Commerce und Werbung bis hin zur Spieleentwicklung und Inhaltserstellung eröffnet die Vielseitigkeit des Modells den Entwicklern neue Möglichkeiten. Durch die Kompatibilität mit GPUs für Endverbraucher wird die Attraktivität noch weiter erhöht und sichergestellt, dass auch kleine Studios seine Fähigkeiten nutzen können.
Shutterstocks Lizenzierungsrahmen bietet eine konforme Alternative, von der sowohl Entwickler als auch Content-Ersteller profitieren. Durch die Nutzung der ethisch beschafften Datensätze von Shutterstock veranschaulicht LTXV, wie Open-Source-Innovation mit ethischen Praktiken in Einklang gebracht werden kann.