穩定性AI與ChIP Designer Arm合作,於2025年5月14日宣布,穩定的音頻開放式Audio Small,緊湊而有效的文本對ADIO人工智能模型。該立體聲AI模型專門優化以完全在ARM CPU上運行,從而在智能手機等設備上直接在不依賴雲處理的設備上可以發電性音頻功能。該版本非常重要,因為它旨在使更多用戶和應用程序的音頻創建民主化,同時特別是通過在免版稅的音頻上接受培訓來解決知識產權的問題。

新模型詳細介紹了穩定性AI的official announcement, features 341 million parameters and can produce up to 11 seconds of audio on a smartphone in under eight seconds.該表演以a 先前宣布的先前宣布的突破性突破性使用ARM MARM使用ARM CONCAM進行了最佳的,在世界各地使用ARM kleies prime 穩定AI首席執行官Akkaraju強調了這一早期成就,他指出:“得益於這些模型的優化和ARM Kleidiai,我們從幾分鐘移到了幾秒鐘,以完全在智能手機上的ARM CPU上產生音頻。”當前穩定的音頻打開的小小的利用這些進步,使其在沒有繁重硬件要求的情況下可以訪問,正如AI新聞指出的那樣。

公司對道德方法的承諾被其使用免費的音樂檔案和自由培訓的使用而強調,這與像Suno相比的一些競爭者,他們在使用Copyre的一些競爭者中遇到了近距離訪問的範圍。允許的穩定性AI社區許可證,在 github ,其研究論文發表於穩定的音頻打開Small的設備處理提供速度和離線功能,這是與許多雲依賴性音頻生成服務的關鍵區別。穩定性AI主要是為聲音效果或音樂即興的短音頻樣本而設計的,但AI承認某些局限性。該模型目前僅支持英語提示,並且尚未針對產生高度逼真的人聲或複雜的,全長的歌曲進行優化。

此外,正如TechCrunch所示的那樣,培訓數據具有西方偏見,潛在地影響了其在各種全球音樂風格中的性能。許可條款的結構是鼓勵廣泛採用的:對於每年收入低於100萬美元的研究人員,業餘愛好者和企業來說,這是免費的。 However, larger entities exceeding this revenue will need an enterprise license from Stability AI.

Navigating the AI Audio Landscape and IP Challenges

Stability AI’s decision to train this model exclusively on royalty-free audio sources is在一個越來越關注知識產權的行業中的戰略舉動。這與其他AI音頻工具形成鮮明對比的是,據稱未經適當授權使用受版權保護的音樂而面臨唱片公司的法律行動。通過使用公開許可的數據,穩定性AI旨在為創建者提供更合法的基礎。

更廣泛的AI音頻領域是動態的,像Elevenlab這樣的公司在2024年6月推出了聲音效果的工具,強調通過合作夥伴關係通過合夥企業進行道德化的數據。 Nvidia還於2024年11月提出了其先進的Fugatto音頻模型,儘管由於對潛在濫用的擔憂,它尚未公開發布,這反映了對強大的生成技術的謹慎方法。最近,Google在4月推出了其Lyria文本到音樂的AI模型,主要是為其企業客戶介紹的,但是,Winbuzzer指出,未指定有關其培訓數據集的詳細信息。

穩定性AI在生成音頻

穩定的穩定性中的穩定性的演出,該穩定性的效果是在穩定的情況下進行的,即將在穩定的穩定性上進行宣傳,以實施措施,即將在即將進行的veriNOTION,即將啟發出來,以實施措施,即將進行宣傳,以實施啟動,即將進行宣傳,以實施啟示,以實施即將到來的效果。其穩定音頻平台的初步發布。專注於基於雲的一代。但是,這個新的“小”版本清楚地將效率和設備部署的優先級優先考慮,與Edge AI的行業趨勢保持一致。

此發布的穩定性AI(以其流行的圖像生成器穩定擴散而聞名),繼續導航競爭激烈的市場。該公司去年籌集了新的現金,經歷了財務重組和領導力的變化。

引入了經過道德訓練的,智障模式,例如穩定的音頻開放,其他最新的圖像生成模型發行,這表明了一種戰略性的努力來創新和鞏固其市場地位。可訪問性,設備性能和免版稅數據基礎的結合可以使穩定的音頻對開發人員和創建者的誘人選擇。