Stabilitate AI, în parteneriat cu Chip Designer Arm, anunțat la 14 mai 2025, lansarea open-source a audio-ului Stabil Open Small, un model compact și eficient de inteligență artificială text-audio. Acest model AI stereo este optimizat în mod specific pentru a rula în întregime pe procesoarele ARM, permițând capacități audio generative direct pe dispozitive precum smartphone-urile fără a se baza pe procesarea în cloud. Eliberarea este semnificativă, deoarece își propune să democratizeze crearea audio pentru o gamă mai largă de utilizatori și aplicații, în timp ce abordează în special problemele de proprietate intelectuală, fiind instruiți exclusiv pe audio fără drepturi de redevență.

noul model, detaliat în stabilitate AI Anunț oficial , caracteristicile de 341 de milioane de parametari și pot produce 11 secunde ale auditorului pe un smartphone în cadrul unei smarts. Această performanță se bazează pe un Anterior anunțate Breakthrough cu ARM la Mobile World Congress 2025, unde Optimizările folosind Arm Kleidiai Library Libraries DRAMATIC World a redus timpurile generației. Akkaraju, CEO al Stability AI, a subliniat această realizare anterioară, afirmând „datorită acestor optimizări de model și brațului Kleidiai, ne-am mutat de la câteva minute la doar câteva secunde pentru a genera audio în întregime pe CPU ARM de pe smartphone”. Actualul Stabil Audio Open Open a efectuat aceste progrese, ceea ce îl face accesibil fără cerințe hardware grele, după cum notează stabilitatea AI News.

Angajamentul companiei față de o abordare etică este subliniat de utilizarea sa de arhiva de muzică gratuită și de freesound pentru antrenament, un contrast cu unii concurenți precum Suno, care s-au confruntat cu un control în conformitate cu un contrast. Permisive Stabilitate AI Licență comunitară , cu greutăți de model disponibile pe hugging Face , cod pe cod <"A Blank"> Hugging Face , cod pe cod. href=”https://github.com/stability-ai/stable-audio-tools”target=”_ blank”> github , și lucrarea sa de cercetare publicată pe Arxiv . AN calea de învățare a brațelor este, de asemenea, disponibilă pentru a ghida dezvoltatorii.

on-d-Device Audio: Capability and consideră On-Device Audio: Capability și consideră că <

Stable Audio Open Open Processing On-Device oferă funcționalități de viteză și offline, un diferențiator cheie de multe servicii de generare audio dependentă de cloud. În timp ce este proiectat în principal pentru eșantioane audio scurte, cum ar fi efectele sonore sau riff-urile muzicale, stabilitate AI recunoaște anumite limitări. Modelul acceptă în prezent doar prompturi în limba engleză și nu este încă optimizat pentru generarea de vocale extrem de realiste sau cântece complexe, de lungime completă.

Mai mult, așa cum este indicat în documentația sa și raportate de TechCrunch, datele de instruire au o prejudecată occidentală, care ar putea avea impact asupra performanței sale în diverse stiluri de muzică globală. Termenii de licență sunt structurați pentru a încuraja adoptarea largă: este gratuit pentru cercetători, pasionați și întreprinderi care câștigă mai puțin de 1 milion de dolari anual. Cu toate acestea, entitățile mai mari care depășesc aceste venituri vor avea nevoie de un Licență de întreprindere de la stabilitate AI.

Navigarea peisajului audio AI și a provocărilor IP

Stabilitate AI-AI THEADE THE TRAED THE THE MODEL THE THE THE THE THE THE THE THE THE KEALTIVESENS On Royertherty Free Royertherty Free Audio Audio a AIT. este o mișcare strategică într-o industrie concentrată din ce în ce mai mult pe drepturile de proprietate intelectuală. Acest lucru contrastează cu alte instrumente audio AI, dintre care unele s-au confruntat cu acțiuni legale de la etichetele de discuri pentru că ar fi folosit muzică protejată de drepturi de autor, fără autorizare adecvată. Prin utilizarea datelor autorizate în mod deschis, Stabilitatea AI își propune să ofere o bază mai legal de sunet pentru creatori.

Câmpul audio AI mai larg este dinamic, companii precum ElevenLabs au lansat instrumente pentru efecte sonore în iunie 2024, subliniind date provenite din punct de vedere etic prin parteneriate. Nvidia a prezentat, de asemenea, modelul său avansat audio Fugatto în noiembrie 2024, deși nu a fost lansat public din cauza îngrijorărilor cu privire la potențialele utilizări greșite, reflectând o abordare prudentă a tehnologiilor generative puternice. Mai recent, Google și-a introdus modelul Lyria Text-to-Music AI în aprilie, în principal pentru clienții săi de întreprindere, totuși, așa cum a menționat WinBuzzer, nu au fost specificate detalii despre seturile de date de instruire. Domeniu, în urma lansării inițiale a platformă audio stabilă În septembrie 2023. Acea iterație anterioară, a dezvoltat cu date de la AudioSparx , axat pe generarea bazată pe cloud. Cu toate acestea, această nouă versiune „mică” prioritizează clar eficiența și implementarea în domeniu, alinându-se la tendința industriei către AI. Compania a experimentat modificări de restructurare financiară și de conducere, a strâns noi numerar anul trecut.

Introducerea unui model instruit etic, în domeniu, precum Stable Audio Open Open mici, alte modele de generare de imagini recente, semnalează un efort strategic pentru a inova și solidifica poziția sa de piață. Combinația de accesibilitate, performanță pe dispozitiv și o fundație de date fără drepturi de redevență ar putea face ca audio-ul stabil să deschidă o opțiune atractivă pentru dezvoltatori și creatori.

Categories: IT Info