A HKUST és az M-A-P kutatócsoportja kiadta a YUE-t, a nyílt forráskódú AI modellek családját, amelyek képesek teljes hosszúságú, öt perces dalokat generálni a Just SMS dalszövegekből. Bejelentették a műszaki cikk az arxivról , a Yue egy olyan iparba lép, amely intenzív jogi ellenőrzéssel. Target=”_ üres”> elérhető a githubon keresztül. Ez a lépés célja az átlátható innováció előmozdítása az AI zene létrehozásában, és egy hatalmas, jogilag hozzáférhető alternatívát kínál a művészek és a fejlesztők számára. A kutatók ezt számos építészeti innovációnak tulajdonítják, amelyben részletesek a papír . src=”https://winbuzzer.com/wp-content/uploads/2024/04/microsoft-voice-ai-generic.jpg”>

Az egyik kulcsfontosságú technika a „track-decukkált jövőbeli predikció”. Ez lehetővé teszi a modell számára, hogy az éneket és a kíséret külön, párhuzamos patakként dolgozzon fel. Ez megakadályozza a sűrű hangszeres metszeteket, amelyek a műfajokban, például a fémben gyakoriak, az elárasztástól és a vokális pályának torzítástól, biztosítva a lírai tisztaságot. Ha egy dalt olyan logikai szegmensekre bontva, mint a [vers] és a [kórus], a modell az egyes szakaszokon belüli dallam-konzisztencia fenntartására összpontosít, mielőtt a következőre lép, és megakadályozza a minőségi lebomlást hosszú szekvenciákon keresztül. A felhasználók rövid audio klipet tudnak biztosítani a stílus irányításához, lehetővé téve a nagy hűségű hangklónozást és a műfaj-hajlító stílusátutalásokat. A hivatalos demo oldal Lenyűgöző példákat mutat be a fejlett vokális technikákra, mint például a scatt, a halálos morgás és a többszörös egy cappella-harmonies. Field

Yue debütálása akkor jön létre, amikor az AI Music World az alapvető jogi kérdésekkel küzd. 2024 júniusában a RIAA a Suno és az Udio perelésével fokozta a konfliktust a tömeges szerzői jogok megsértése miatt. Mitch Glazier, a RIAA elnöke és vezérigazgatója figyelmeztette, hogy „az olyan engedély nélküli szolgáltatások, mint a Suno és az Udio, akik azt állítják, hogy„ tisztességes “a művész életének másolása… Az igazi innovatív AI ígéretét mindannyiunk számára.”hatalmas skála.”Mindkét vállalat megvédte technológiáját a „tisztességes felhasználás” doktrína alatt, amikor a Suno vezérigazgatója, Mikey Shulman azt állította, hogy modellje „… teljesen új outputok generálására szolgált, nem pedig a már létező tartalom megjegyzésére és újjáélesztésére.”

A jogi csata aktív, bár a nagy lemezkiadók, mint például a Universal, a Sony és a Warner, mindkét oldalról szóló tárgyalásokon. Ennek a bizonytalanságnak a közepette más játékosok egy óvatosabb pályát ábrázolnak. A Voice AI Startup ElevenLabs nemrégiben elindította saját eszközét, az Eleven Music-ot, amelyet egy „licenc-első” stratégiára építettek. Mati Staniszewski vezérigazgató hangsúlyozta, hogy „a modellt szigorúan létrehozzák az adatokkal, amelyekhez hozzáférünk.”

Az AI zenei háborúk: A perek és a licencek tájképe

Az innováció és az intellektuális tulajdonjogok feszültsége meghatározza a jelenlegi AI földterületképet. Az iparág továbbra is mélyen megoszlik, hogyan kell folytatni, és arra kényszerítve a platformokat és a technológiai vállalatokat, hogy gondosan válasszák meg stratégiájukat. A Google Music AI Sandbox vízjele az összes kimenetet a nyomon követhetőség biztosítása érdekében. Az Nvidia még konzervatívabb lépést tett, és bemutatta erőteljes Fugatto audio modelljét, de visszatartotta a nyilvános kiadását. A társaság alelnöke, Bryan Catanzaro megjegyezte, hogy „bármilyen generációs technológia mindig hordoz bizonyos kockázatot, mert az emberek ezt felhasználhatják olyan dolgok előállításához, amelyeket inkább nem akarunk.” A Spotify megerősítette, hogy ez lehetővé tenné az AI zenét, de a rendõrség jogosulatlan hangszenvedõi, míg a Universal Music és a Deezer korábban bejelentették egy „művész-központú” modellt, hogy az emberi alkotókat rangsorolják a jogdíj-számításokban. Míg egyes művészek együttműködési eszközként veszik át az AI-t, mások attól tartanak, hogy lebecsüli az emberi művészetet. Ezt az érzést Joanna Maciejewska szerző híresen rögzítette, aki kijelentette: „Azt akarom, hogy Al mossa és ételeimet készítsen, hogy művészetet és írást tudjak csinálni, nem pedig az AL-t, hogy a művészetet és az írást tegyem, hogy meg tudjam csinálni a mosodámat és az ételeimet.”Target=”_ üres”> nyílt forráskódú eszköz , alkotói szándékos nyilatkozatot tesznek. Fogadják, hogy az átláthatóság és a közösség által vezérelt fejlődés, nem pedig a zárt ajtó peres eljárásai végül meghatározzák az AI jövőjét a zenében.

Categories: IT Info