A Shutterstock bemutatott egy etikus engedélyezési modellt, amelynek célja, hogy átalakítsa a mesterséges intelligencia fejlesztőinek minőségi képzési adatokhoz való hozzáférését.

Az új Shutterstock kutatási licenc lehetővé teszi az AI induló vállalkozások és kisebb fejlesztők számára, hogy megfizethető áron és felelősségteljesen képezzék ki az AI-rendszereket. Az első alkalmazása az LTXV-t (LTX Video) táplálja, egy valós idejű videógeneráló modellt, amelyet a cég fejlesztett ki. Lightricks.

A Shutterstock HD-és 4K-videókból álló hatalmas könyvtárának felhasználásával a Lightricks célja, hogy leküzdje a mesterséges intelligencia-videógyártás technikai akadályait, miközben betartja az etikai normákat. A több mint 800 millió képből és 55 millió videoklipből álló hatalmas könyvtárával A Shutterstock jelenleg körülbelül 4,1 millió aktív ügyfelet szolgál ki

“Sok cég és modellképző az illetéktelen adatlekopasztás útját választotta [ahelyett], hogy megtenné a szükséges befektetést a szükséges minőség és bizalomszint eléréséhez kereskedelmileg életképes modellek fejlesztésére” – mondta Daniel Mandell, a Shutterstock globális vezetője az adatlicencelés és a mesterséges intelligencia terén.

„Úgy gondoljuk azonban, hogy a pénzügyi befektetés nem akadályozhatja azokat, akik etikus megközelítéssel szeretnének belépni erre a területre.”

Kapcsolódó: Az OpenAI kiadja a Sora AI Video Generatort a ChatGPT Plus és Pro előfizetőknek

A Shutterstock kutatási engedélye: kétfázisú licenc Modell

A Shutterstock kutatási engedélye kétfázisú engedélyezési keretrendszert vezet be, amelynek célja a mesterséges intelligencia képzésével kapcsolatos túl magas költségek kezelése. A kezdeti szakaszban a fejlesztők kisebb adatkészletekkel kísérletezhetnek tesztelés és érvényesítés céljából.

Ha projektjeik készen állnak a kereskedelmi forgalomba hozatalra, áttérhetnek a teljes kereskedelmi licencekre. Ennek a rugalmas megközelítésnek az a célja, hogy csökkentse az induló vállalkozások és a kisebb szervezetek belépésének pénzügyi akadályait.

Mandell hangsúlyozta, hogy a Shutterstock célja az volt, hogy etikai normákat alakítson ki a mesterséges intelligencia fejlesztése során, és méltányos kompenzációt biztosítson a tartalomkészítők számára.

A mesterséges intelligencia videogenerálásának egyik legmaradandóbb kihívása a sima, koherens mozgás fenntartása a képkockákon keresztül, különösen a hosszabb klipeknél. Az LTXV architektúráját kifejezetten ennek a problémának a kezelésére tervezték. A Shutterstock sokrétű és kiváló minőségű videoadatkészletein való képzéssel az LTXV olyan szintű mozgáskonzisztenciát ér el, amely megkülönbözteti a versenytárs modellektől.

„A Shutterstock adatai lehetővé teszik számunkra, hogy felelősségteljesen és etikusan képezzük a modelleket” – mondta Zeev Farbman. , a Lightricks vezérigazgatója „Ez a partnerség biztosítja, hogy tiszteletben tartsuk az alkotói jogokat, miközben fejlesztjük cégünk technikai lehetőségeit eszközöket.”

Kapcsolódó: A Meta bemutatja a videopecsét keretrendszert a rejtett mesterséges intelligencia vízjelekhez

Méltányos kompenzáció a közreműködők számára

A Shutterstock platformjának közreműködői a bevételmegosztási modell előnyeit élvezik, mivel az adatlicencelési szerződésekből származó bevétel 20%-át kapják. Ezenkívül a tartalomkészítők leiratkozhatnak arról, hogy munkájukat mesterséges intelligencia képzési célokra használják fel, és ezt a Shutterstock közreműködőinek kevesebb mint 1%-a teszi meg.

A Mandell ezt az alacsony leiratkozási arányt az engedélyezési modell átláthatóságának és tisztességességének tulajdonítja.

A kezdeményezés a Shutterstockot az etikus mesterségesintelligencia-gyakorlatok ösztönzőjeként pozicionálja egy olyan időszakban, amikor az iparág egyre nagyobb ellenőrzésekkel kell szembenéznie az adatbeszerzést illetően. Számos pert indítottak az AI-cégek ellen, akiket azzal vádolnak, hogy jogosulatlanul használnak szerzői joggal védett anyagokat képzési adatkészleteikben.

Kapcsolódó: Az Amazon bemutatja a Nova multimodális mesterséges intelligencia modelleket szöveghez, képhez és videóhoz

Az LTXV képességei: Valós idejű mesterséges intelligencia videógenerálás

A Lightricks által kifejlesztett LTXV a lejátszási sebességnél gyorsabban tud videókat készíteni, így generál 24 képkocka/másodperc, és a nagy felbontású videók akár 30 másodperc alatt is elérhetők csúcskategóriás hardveren.

Az LTXV többféle módot kínál művelet, beleértve a szöveg-videó, kép-videó és videó-videó generálást. Ezek a funkciók lehetővé teszik az alkotók számára, hogy animációkat hozzanak létre, átalakítsák a meglévő felvételeket, vagy leíró utasítások alapján teljesen új videókat hozzanak létre. Ezeknek az eszközöknek a rugalmassága lehetővé teszi az LTXV-t mind a professzionális filmesek, mind a független alkotók számára.

Kép: lightricks/LTXV

Műszaki újítások

A modell diffúziós transzformátorra épül (DiT) architektúra kétmilliárd paraméterrel, amely lehetővé teszi a képkockák közötti sima átmenetek elérését és a konzisztencia megőrzését a kiterjesztett klipeknél.

Az LTXV alapértelmezett kimeneti felbontása 768 × 512, de a teljesítmény megőrzése mellett akár 720 × 1280-ra is méretezhető. Ellentétben sok mesterséges intelligencia-modellel, amelyek erőteljes infrastruktúrát igényelnek, az LTXV hatékonyan tud működni fogyasztói minőségű GPU-kon, mindössze 6 GB VRAM-mal, így elérhetősége kisebb stúdiók és egyéni fejlesztők számára is elérhető.

Kapcsolódó

Kapcsolódó

strong>: A Google Vertex AI most kínálja a Veo AI videogenerátort és az Imagen 3 szöveg-kép modellt

Craig Andrews, a vállalat globális PR-menedzsere Lightricks kijelentette, hogy a mozgás konzisztenciája volt az egyik legnagyobb technikai kihívás az AI-videók generálásában, és kifejtette, hogy a Shutterstock videokönyvtára alapvető szerepet játszott a probléma megoldásában.

Kép: lightricks/LTXV

Az LTXV az Apache alatt jelenik meg 2.0 licenc, így szabadon hozzáférhetővé teszi a módosítást, a felhasználást és a terjesztést. Ez a nyílt forráskódú keretrendszer ösztönzi a fejlesztők és kutatók közötti együttműködést, miközben biztosítja a hozzáférést a független alkotók és kisvállalkozások számára. A modell a GitHubon és a Hugging Face-en található, ahonnan már több ezer alkalommal letöltötték.

A nyílt forráskódú elérhetősége mellett az LTXV olyan platformokkal is integrálható, mint a ComfyUI, amely lehetővé teszi a felhasználók számára, hogy testreszabják és igazítsák a funkcióit az egyedi igényekhez. Ez a fokú rugalmasság az LTXV-t értékes eszközzé teszi mind a műszaki szakértők, mind a kreatív szakemberek számára.

Kapcsolódó: Az Adobe bemutatja az AI Video Tools eszközt a Premiere Pro alkalmazásban, kibővíti a Firefly-t

Az LTXV azon képessége, hogy kibővített klipeket állítson elő egyenletes minőségben, rendkívül méretezhetővé teszi a különféle alkalmazásokhoz. Az interaktív e-kereskedelemtől és reklámozástól a játékfejlesztésig és tartalomkészítésig a modell sokoldalúsága új lehetőségeket nyit meg az alkotók előtt. A fogyasztói minőségű GPU-kkal való kompatibilitása tovább növeli vonzerejét, biztosítva, hogy még a kis stúdiók is ki tudják használni a képességeit.

A Shutterstock licencrendszere megfelelő alternatívát kínál, amely a fejlesztők és a tartalomkészítők számára egyaránt előnyös. A Shutterstock etikus forrásból származó adatkészleteinek felhasználásával az LTXV jól példázza, hogy a nyílt forráskódú innováció hogyan tud igazodni az etikai gyakorlatokhoz.

Categories: IT Info