Et team av forskere fra HKUST og M-A-P har gitt ut Yue, en familie av Open Source AI-modeller som er i stand til å generere fem-minutters sanger fra bare tekster. Kunngjort sammen med en Teknisk papir på arxiv , oppgir Yue en bransje som står overfor intens LegalySy. Target=”_ Blank”> Tilgjengelig via github Under en tillatt apache 2.0-lisens . Dette trekket tar sikte på å fremme gjennomsiktig innovasjon innen AI-musikkskaping, og tilbyr et kraftig, juridisk tilgjengelig alternativ for artister og utviklere.

under panseret: Hvordan Yue genererer sanger i full lengde

bygget på Llama 2-arkitekturen og trene på trillen. Forskerne tilskriver dette flere arkitektoniske innovasjoner beskrevet i deres papir .

En nøkkelteknikk er”Track-Decupled Next-Token Prediction.”Dette gjør at modellen kan behandle vokal og akkompagnement som separate, parallelle strømmer. Dette forhindrer tette instrumentelle seksjoner, vanlig i sjangre som metall, fra å overveldende og forvrenge vokalsporet, og sikre lyrisk klarhet.

For å opprettholde langsiktig sammenheng, bruker Yue”strukturell progressiv kondisjonering.”Ved å dele en sang i logiske segmenter som [vers] og [Chorus], fokuserer modellen på å opprettholde melodisk konsistens i hver seksjon før den går til den neste, og forhindrer kvalitetsnedbrytning over lange sekvenser.

Modellen viser også en sofistikert in-context-læring (ICL) evne. Brukere kan gi et kort lydklipp for å veilede stilen, slik at den er høykvalitetsstemmekloning og overføring av sjanger-bøyende stil. offisiell demoside Funksjoner imponerende eksempler på avanserte vokalteknikker som ikke er eksplisitt trent for, som scatting, Death Growls og Open-Cappa-harmonier. Felt

Yues debut kommer når AI Music World griper med grunnleggende juridiske spørsmål. I juni 2024 eskalerte RIAA konflikten ved å saksøke Suno og Udio for brudd på masseopphavsretten. RIAA-styreleder og administrerende direktør Mitch Glazier advarte om at”ulisensierte tjenester som Suno og Udio som hevder at det er”rettferdig”å kopiere en kunstners livsverk… Sett tilbake løftet om virkelig nyskapende AI for oss alle.”

Det juridiske slaget forblir aktivt, selv om store plateselskaper som Universal, Sony, og Warner nå er rapportert nå i laktens, samtaler for å snakke om å snakke med likt. Midt i denne usikkerheten kartlegger andre spillere et mer forsiktig kurs. Voice AI Startup Elevenlabs lanserte nylig sitt eget verktøy, Eleven Music, bygget på en”lisens-første”strategi. Administrerende direktør Mati Staniszewski la vekt på at”modellen er strengt opprettet på data som vi har tilgang til.”

AI Music Wars: et landskap av søksmål og lisenser

Spenningen mellom innovasjon og åndsverksrettigheter definerer gjeldende AI-musikklandskap. Bransjen er fortsatt dypt splittet om hvordan de skal gå frem, og tvinger plattformer og teknologiselskaper til å velge strategier nøye.

Tech-giganter tråkker nøye. Googles musikk AI Sandbox vannmerker alle utgangene for å sikre sporbarhet. Nvidia tok et enda mer konservativt skritt, og avduket sin kraftige Fugatto-lydmodell, men holdt tilbake den offentlige utgivelsen. En firma-VP, Bryan Catanzaro, bemerket at “enhver generativ teknologi alltid har noen risikoer, fordi folk kan bruke det for å generere ting som vi foretrekker at de ikke gjør.”

Streaming-plattformer tegner også linjer. Spotify bekreftet at det ville tillate AI-musikk, men politiet uautorisert stemmeoppstilling, mens Universal Music og Deezer tidligere kunngjorde en”kunstner-sentrisk”modell for å prioritere menneskelige skapere i kongelige beregninger.

Denne forsiktighet gjenspeiler en bredere angst i det kreative samfunnet. Mens noen artister omfavner AI som et samarbeidsverktøy, frykter andre at det devaluerer menneskelig kunstnerskap. Dette følelsen ble berømt tatt til fange av forfatteren Joanna Maciejewska, som uttalte:”Jeg vil at jeg skal vaske og retter, slik at jeg kan gjøre kunst og skrive, ikke for at jeg skal gjøre min kunst og skrive, slik at jeg kan gjøre mine retter og retter.”

ved å gi ut Yue som en kraftig, open source tool , skaperne gir en bevisst uttalelse. De satser på at åpenhet og samfunnsdrevet utvikling, snarere enn lukket dør-rettssaker, til slutt vil definere fremtiden til AI i musikk.

Categories: IT Info