Stabilitate AI a lansat Stable Audio 2.5, un nou instrument audio AI construit pentru utilizarea afacerilor. Lansat pe 10 septembrie, modelul marchează un salt major în viteză, generând piese de trei minute în mai puțin de două secunde. Această actualizare ajută companiile să creeze sunet personalizat la scară pentru anunțuri, jocuri și experiențe de marcă.

Noua versiune adaugă caracteristici profesionale, cum ar fi audio, oferind utilizatorilor un control fin pentru a edita fișiere de sunet. Pentru a-și susține Focus Enterprise, Stabilitatea AI s-a asociat cu Agenția de sunet AMP. Instruit pe un set de date complet licențiat, instrumentul este sigur în comerț, rezolvând o problemă cheie pentru întreprinderi.

Release Continuă stabilitatea evoluției AI în spațiul audio. Urmează lansarea inițială a platformei în septembrie 2023 și actualizarea versiunii 2.0 în aprilie 2024. Compania a lansat, de asemenea, un model pe dispozitiv cu ARM în mai 2025, concentrându-se pe audio-liber. și Control Creative

Nucleul audio 2.5 stabil este o nouă metodă post-instruire numită adversar relativist-contrastiv (ARC). Această inovație sporește dramatic eficiența. Reduce etapele de calcul necesare generației de la 50 în versiunea anterioară până la doar opt.

Zach Evans, șeful cercetării audio la Stabilitate AI, a explicat noua tehnică. He told VEntureb, “the Adversarial Relativistic-Contrastive (ARC) method is a post-training technique that sidesteps traditional approaches requiring teacher models, distillation, or Îndrumări fără clasificator, „subliniind plecarea sa de la mai multe metode cu consum de resurse. Această eficiență se traduce direct la viteză, permițând o iterație rapidă pentru profesioniștii creativi.

dincolo de viteza brută, modelul introduce inpainarea audio. Această caracteristică permite utilizatorilor să introducă un fișier audio existent, să selecteze o secțiune specifică și să aibă AI să genereze conținut nou care se potrivește contextului. Aceasta oferă un nivel de control granular anterior indisponibil în instrument.

Compozițiile muzicale sunt, de asemenea, mai sofisticate. Modelul produce acum piese cu structuri mai clare, cum ar fi o introducere, dezvoltare și outro. Aceasta abordează o critică comună a muzicii AI, în care ieșirile se pot simți repetitive sau fără scop.

[Conținut încorporat]

care vizează întreprinderea cu brandingul sonic personalizat

Această lansare semnalează o schimbare strategică clară și deliberată către piața întreprinderii, unde stabilitatea se află o oportunitate semnificativă și neexecutată. Doar ca un generator audio, dar ca instrument de bază pentru crearea de identități sonice unice și consistente.

citarea cercetării Ipsos, compania evidențiază un decalaj major în brandingul modern: în timp ce audio personalizat poate face o marcă de opt ori mai memorabilă, doar o fracțiune minusculă a muncii creative încorporează o identitate sonoră. canale. Aceasta include totul, de la S tradițional și creditele de deschidere ale unui joc până la muzica ambientală dintr-un magazin de vânzare cu amănuntul sau de a fi subtile ale unui card de credit. Diferențiator: reglare fină. Echipa companiei poate lucra cu o organizație pentru a antrena o versiune personalizată a modelului pe biblioteca sa de sunet existentă.

Acest proces încorporează audio semnat al mărcii direct în fluxurile sale de lucru generative. Rezultatul este că orice muzică sau peisaj sonor produs este în mod unic recunoscut și se aliniază perfect cu orientările Sonic consacrate ale mărcii, asigurând consecvența pe toate punctele de atingere.

Solidizarea în continuare a acestei concentrări a întreprinderii este un parteneriat strategic cu AMP, o agenție de marcă solidă care face parte din grupul Landor și o companie WPP. Colaborarea este mai mult decât o simplă aprobare; Este o inițiativă de co-dezvoltare care vizează crearea de soluții inovatoare pentru mărci de top.

Prin această alianță, Stable Audio 2.5 va fi pusă la dispoziția bazei de clienți globale extinse a WPP prin intermediul platformei WPP Open, combinând efectiv stabilitatea tehnologiei avansate AI cu expertiza creativă a AMP. Evoluția fundamentală a scopului platformei.

he a declarat ,”2.5 nu este doar o iSerație pe 2.0. Audio, performanță mai rapidă și controlul avansat necesar pentru cazurile de utilizare comercială…”. Acest lucru subliniază ambiția companiei de a tranziția audio stabil de la un instrument de consum promițător într-o platformă robustă, indispensabilă pentru profesioniști creativi și mărci globale.

navigând un peisaj audio AI competitiv și precaut Companii precum Adobe, Microsoft și ElevenLabs au lansat toate instrumente puternice de generare audio. Fiecare concurează pentru dominare într-un spațiu plin atât de oportunități, cât și de provocări etice.

Stabilitatea AI accentul pe un set de date de instruire complet autorizat este o mișcare strategică. Oferă siguranță comercială și ajută clienții să evite procesele de încălcare a drepturilor de autor care au afectat alte firme AI. Această asigurare legală este esențială pentru adoptarea întreprinderilor.

Cu toate acestea, industria rămâne prudentă cu privire la potențialul de abuz. Nvidia, de exemplu, și-a dezvoltat modelul avansat Fugatto, dar a reținut până acum o eliberare publică asupra acestor preocupări.

Bryan Catanzaro, un VP la Nvidia, a avertizat la momentul respectiv, „Orice tehnologie generativă are întotdeauna anumite riscuri, deoarece oamenii ar putea folosi că pentru a genera lucruri pe care le-am prefera,„ Recceptarea unor sentimente comune. aplicații și mai avansate. Evans a sugerat viitorul, spunând: „Lucrarea noastră recentă de cercetare evidențiază posibilitățile creative care urmează, de la generarea de muzică în timp real la un design de sunet interactiv, cu muzică care se adaptează dinamic la publicul său,„ Referință a recent document de cercetare Experiențe audio interactive în timp real, care ar putea redefini implicarea digitală.

Categories: IT Info