Stability AI & ARM julkaisee laitteen, Royalty-Free Text to Audio AI-malli

Stability AI ilmoitti yhteistyössä Chip Designer ARM: n kanssa 14. toukokuuta 2025, Stable Audio Audio Small-yhtiön avoimen lähdekoodin julkaisu, kompakti ja tehokas tekstistä to-audio-tekoälymalli. Tämä stereo-AI-malli on erityisesti optimoitu toimimaan kokonaan ARM-suorittimissa, mikä mahdollistaa generatiiviset ääniominaisuudet suoraan laitteisiin, kuten älypuhelimiin luottamatta pilvien käsittelyyn. Julkaisu on merkittävä, koska sen tavoitteena on demokratisoida äänen luominen laajemmalle käyttäjille ja sovelluksille, vaikka se käsittelee erityisesti immateriaalioikeuksia koskevia huolenaiheita, kun hänet koulutetaan yksinomaan rojaltivapaasta äänestä. href=”https://stability.ai/news/stability-Ai-and-Arm-release-stable-audio-open-small-enabling-real-world-deployment-for-on-on-device-audio-control”Target=”_ tyhjä”> virallinen ilmoitus , on 341 miljoonaa parametria ja pystyy tuottamaan jopa 11 sekunnille ääniä. Tämä esitys perustuu aiemmin ilmoitetut läpimurron ARM: n kanssa Mobile World Congress 2025: n avulla, jossa optimisaatiot käyttämällä armeijan Kleidiai-kirjastoja. Akkaraju, Stability AI: n toimitusjohtaja, korosti tätä aikaisempaa saavutusta, jossa todettiin, että näiden mallioptimointien ja käsivarsi kleidiain ansiosta muutimme minuutteista vain sekunneihin tuottaaksemme äänen kokonaan älypuhelimen käsivarren prosessorilla”. Nykyinen vakaa ääni avaa pieniä hyödyntää näitä edistysaskeleita, jolloin se on saatavana ilman raskaita laitteistovaatimuksia, koska vakaus AI-uutiset.

Yrityksen sitoutumista eettiseen lähestymistapaan korostetaan ilmaisen musiikkiastiston käyttö ja vapauttanut koulutuksen, toisin kuin SUNO: n kaltaiset kilpailijat, jotka ovat joutuneet soittamaan aukkoon. sallitus Stabiilisuus AI-yhteisön lisenssi , mallipainot, jotka ovat saatavilla halaus kasvot github , ja sen tutkimuspaperi, joka on julkaistu arxiv . An ARM-oppimispolku on myös oppaan kehittäjien käytettävissä.

Vakaa Audio Open Small’s-laitteen prosessointi tarjoaa nopeuden ja offline-toimintojen, mikä on keskeinen erottaja monista pilvestä riippuvaisista audiotuotantopalveluista. Vaikka Stability AI on suunniteltu ensisijaisesti lyhyille ääninäytteille, kuten äänitehosteet tai musiikilliset riffit, se tunnustaa tietyt rajoitukset. Malli tukee tällä hetkellä vain englanninkielisiä kehotuksia, eikä sitä ole vielä optimoitu erittäin realististen laulujen tai monimutkaisten, täysipitkien kappaleiden tuottamiseksi.

Lisäksi, kuten TechCrunch on osoittanut dokumentoinnissa ja raportoi, koulutustieto on länsimainen puolueellisuus, mikä voi vaikuttaa sen suorituskykyyn monimuotoisissa globaaleissa musiikkityyleissä. Lisensointiehdot on rakennettu edistämään laajaa käyttöönottoa: Se on ilmainen tutkijoille, harrastajille ja yrityksille, jotka ansaitsevat alle miljoona dollaria vuodessa. Suuremmat kokonaisuudet, jotka ylittävät tämän tuloksen, tarvitsevat kuitenkin Enterprise-lisenssi Stability Ai. on strateginen muutos teollisuudessa, joka keskittyy yhä immateriaalioikeuksiin. Tämä on ristiriidassa muiden AI-äänityökalujen kanssa, joista jotkut ovat joutuneet oikeustoimiin levy-yhtiöistä väitetysti tekijänoikeuksien alaisen musiikin käytön ilman asianmukaista lupaa. Käyttämällä avoimesti lisensoitua tietoa Stability AI: n tavoitteena on tarjota oikeudellisempi perusta tekijöille.

Laajempi AI-audiokenttä on dynaaminen, kun yritysten kaltaiset yritykset ovat käynnistäneet työkalut äänivaikutuksiin kesäkuussa 2024, ja korostavat eettisesti hankittuja tietoja kumppanuuksien kautta. NVIDIA esitteli myös edistyneen Fugatto-äänimallinsa marraskuussa 2024, vaikka sitä ei ole julkisesti julkaistu mahdollisen väärinkäytön huolenaiheiden vuoksi, mikä heijastaa varovaista lähestymistapaa voimakkaaseen generatiiviseen tekniikkaan. Äskettäin Google esitteli Lyria-tekstinsä-musiikki-AI-mallinsa huhtikuussa pääasiassa yritysasiakkailleen, mutta kuten Winbuzzer totesi, yksityiskohtia sen harjoitustietojoukkoista ei määritelty. Verkkotunnus, sen vakaa ääni-alusta syyskuussa 2023. Se aikaisempi iteraatio, kehitetty tietojen AudiosParx , keskittyy pilvipohjaiseen sukupolveen. Tämä uusi “pieni”versio kuitenkin priorisoi selvästi tehokkuuden ja laitteen käyttöönoton, yhdenmukaistaen alan suuntauksen kanssa kohti Edge AI: tä.

Tämä lanseeraus tulee Stability AI: n, joka tunnetaan suosituista imagegeneraattorin vakaa diffuusiosta, jatkaa kilpailukykyisten markkinoiden navigointia. Yhtiö on kokenut taloudellisia uudelleenjärjestelyjä ja johtamismuutoksia, kun hän on kerännyt uutta käteisvaroja viime vuonna.

eettisesti koulutetun, laitteen mallin käyttöönotto, kuten vakaa ääni Open Small, muut viimeaikaiset kuvantuotantomallijulkaisut, merkitsee strategista pyrkimystä innostaa ja vahvistaa sen markkina-asemaansa. Saavutettavuuden, laitteen suorituskyvyn ja Royalty-Free Data-säätiön yhdistelmä voisi tehdä vakaa äänen avoimesta pienestä houkuttelevan vaihtoehdon kehittäjille ja tekijöille.

Stability AI & ARM julkaisee laitteen, Royalty-Free Text to Audio AI-malli

Published by All Things Windows on May 14, 2025

IT Info

Kuinka testata nopean koneen palautuksen Windows 11: ssä

IT Info

Kuinka saada nopea koneen palautus Windows 11: ssä

IT Info

Openai linkit chatgpt syvän tutkimuksen Microsoft Onedrive & SharePointiin

Stability AI & ARM julkaisee laitteen, Royalty-Free Text to Audio AI-malli

Published by All Things Windows on May 14, 2025

Related Posts

IT Info

Kuinka testata nopean koneen palautuksen Windows 11: ssä

IT Info

Kuinka saada nopea koneen palautus Windows 11: ssä

IT Info

Openai linkit chatgpt syvän tutkimuksen Microsoft Onedrive & SharePointiin