Stabilitet AI, i samarbeid med Chip Designer Arm, kunngjort 14. mai 2025, åpen kildekodeutgivelse av Stable Audio Open Small, en kompakt og effektiv tekst-til-Audio kunstig intelligensmodell. Denne Stereo AI-modellen er spesielt optimalisert for å kjøre helt på ARM-CPU-er, noe som muliggjør generative lydfunksjoner direkte på enheter som smarttelefoner uten å stole på skybehandling. Utgivelsen er viktig ettersom den tar sikte på å demokratisere lydoppretting for et bredere spekter av brukere og applikasjoner, samtidig som den blir talt for intellektuelle eiendommer ved å bli trent utelukkende på royaltyfri lyd.
Den nye modellen, beskrevet i Stability AIs offisiell kunngjøring , har 341 Million Paramet ( sekunder. Denne forestillingen bygger på en
Prem Akkaraju, administrerende direktør i Stability AI, fremhevet denne tidligere prestasjonen, og sa”Takket være disse modelloptimaliseringene og arm Kleidiai, flyttet vi fra minutter til bare sekunder for å generere lyd helt på ARM CPU på smarttelefonen.”Den nåværende stabile lyden som åpner små utnytter disse fremskrittene, noe den tillatte Stabilitet AI Community License , med modellvekter tilgjengelig på github , og forskningsoppgaven publisert på arm læring er også tilgjengelig for guide.
Stabil lyd som åpner Smalls prosessering på enheter tilbyr hastighet og offline funksjonalitet, en viktig differensierer fra mange skyavhengige lydgenereringstjenester. Mens de først og fremst er designet for korte lydprøver som lydeffekter eller musikalske riff, erkjenner Stability AI visse begrensninger. Modellen støtter for øyeblikket bare engelske spørsmål og er ennå ikke optimalisert for å generere svært realistiske vokal eller komplekse sanger i full lengde.
Videre, som indikert i sin dokumentasjon og rapportert av TechCrunch, har treningsdataene en vestlig skjevhet, og potensielt påvirker ytelsen på tvers av forskjellige globale musikkstiler. Lisensvilkårene er strukturert for å oppmuntre til bred adopsjon: Det er gratis for forskere, hobbyister og bedrifter som tjener mindre enn 1 million dollar årlig. Imidlertid vil større enheter som overstiger denne inntekten trenge en Enterprise License Fra Stability AI.
Det bredere AI-lydfeltet er dynamisk, med selskaper som ellevelabs som har lansert verktøy for lydeffekter i juni 2024, og understreket etisk hentet data gjennom partnerskap. Nvidia presenterte også sin avanserte Fugatto-lydmodell i november 2024, selv om den ikke har blitt offentliggjort offentlig på grunn av bekymring for potensiell misbruk, og gjenspeiler en forsiktig tilnærming til kraftige generative teknologier. Nylig introduserte Google sin Lyria-tekst-til-musikk AI-modell i april, først og fremst for sine bedriftskunder, men som Winbuzzer bemerket, var detaljer om treningsdatasettene ikke spesifisert.
Stabilitet Ai’s Audio Open Audio
The Release of Evolution i Generative Audio
Domene, etter den første lanseringen av sin stabil lydplattform i september 2023. At tidligere iterasjon, utviklet med data fra en href=”https Target=”_ Blank”> Audiosparx , fokusert på skybasert generasjon. Denne nye”lille”versjonen prioriterer imidlertid tydelig effektivitet og distribusjon på enheten, og samsvarer med bransjetrenden mot Edge AI.
Denne lanseringen kommer som stabilitet AI, kjent for sin populære bildegenerator stabil diffusjon, fortsetter å navigere i et konkurransedyktig marked. Selskapet har opplevd økonomisk omstilling og lederendringer, etter å ha hevet nye kontanter i fjor.
Innføringen av en etisk trent, enhetsmodell som stabil lyd som åpner små, andre nylige utgivelser av bildegenereringer, signaliserer en strategisk innsats for å innovere og styrke sin markedsposisjon. Kombinasjonen av tilgjengelighet, ytelse på enheten og et royalty-fritt dato-fundament kan gjøre stabil lyd til å åpne lite til et attraktivt alternativ for utviklere og skapere.