穩定性AI啟動了穩定的音頻2.5,這是一種新的供業務使用的新型AI音頻工具。該模型於9月10日發布,標誌著速度的重大飛躍,在不到兩秒鐘內產生了三分鐘的軌道。此更新可幫助公司為廣告,遊戲和品牌體驗創建自定義聲音。
新版本添加了專業功能,例如音頻介紹,為用戶提供了精細的控制來編輯聲音文件。為了支持其企業重點,穩定性AI與Sound Agency AMP合作。該工具在完全許可的數據集上進行了培訓,在商業上是安全的,可以解決企業的關鍵問題。
釋放繼續在音頻空間中繼續穩定性AI的演變。它遵循2023年9月的初始平台啟動和2024年4月的2.0版更新。該公司還於2025年5月發布了與ARM一起使用的設備模型,重點關注免版稅音頻。
穩定音頻2.5的核心是一種新的訓練方法,稱為對抗性相對論對比度(ARC)。這種創新極大地提高了效率。它將發電所需的計算步驟從上一個版本中的50個削減到僅8個。他 vent ventureb,“ “或無分類器的指導,“強調其與更多資源密集型方法的不同。這種效率直接轉化為速度,為創意專業人士提供快速迭代。
超過原始速度,該模型引入了音頻介紹。此功能允許用戶輸入現有音頻文件,選擇特定部分,並使AI生成適合上下文的新內容。這在工具中提供了以前無法使用的顆粒狀控制。
音樂作品也更加複雜。該模型現在生產具有更清晰的結構的軌道,例如介紹,開發和OUTRO。這解決了對AI音樂的普遍批評,在該音樂中,輸出可以讓人感到重複或毫無目的。僅是作為音頻發電機,而是作為創建獨特且一致的聲音身份的基礎工具。
引用ipsos研究的引用,該公司在現代品牌的研究中存在一個重大差距:雖然自定義音頻可以使品牌更令人難忘,但只有很小的一小部分創意工作才能快速地構成一定的範圍。頻道。這包括從傳統s和遊戲的開放性信用到零售商店中的環境音樂或信用卡刷卡的微妙聲音。
穩定的音頻2.5是專門的,可以解決這種需求,以滿足可擴展,適應性和商業上級別的音頻產生的可擴展性,超越簡單的聲音效果的功能,以啟用策略性品牌表達。市場區分:微調。該公司的團隊可以與組織合作,在其現有聲音庫上訓練該模型的定製版本。
此過程將品牌的簽名音頻直接嵌入其生成工作流中。結果是,所產生的任何音樂或音景都是可獨特的,並且與該品牌已建立的聲音指南完全吻合,確保在所有接觸點上保持一致性。
進一步鞏固了該企業的重點是與AMP的戰略合作夥伴關係,這是與Landor and a Landor Group and Wpp and Wpp Company的一部分。該協作不僅僅是一個簡單的認可。 it is a co-development initiative aimed at creating innovative solutions for top-tier brands.
Through this alliance, Stable Audio 2.5 will be made available to WPP’s extensive global client base via the WPP Open platform, effectively combining Stability AI’s advanced technology with amp’s deep creative expertise.
Zach Evans, Head of Audio Research at Stability AI, emphasized that this release represents a平台目的的基本演變。專業質量的音頻,更快的性能和商業用例所需的高級控制……”。這強調了該公司將穩定音頻從有前途的消費者工具轉變為專業和全球品牌的強大,必不可少的平台。
導航競爭性和謹慎的AI音頻景觀
Adobe,Microsoft和Elevenlab等公司都推出了強大的音頻生成工具。每個人都在爭奪既有機會又有道德挑戰的空間中爭奪優勢。它提供了商業安全,並幫助客戶避免了困擾其他AI公司的版權侵權訴訟。這種法律保證對於企業採用至關重要。
但是,該行業對濫用的潛力保持謹慎。例如,NVIDIA開發了其先進的Fugatto模型,但到目前為止,NVIDIA的副總裁
Bryan Catanzaro(NVIDIA的副總裁)在當時警告說,任何生成技術總是會帶來一些風險,因為人們可能會使用更多的研究來產生更多的研究,因為我們會更喜歡他們,而不得不反映出一定的p,
高級應用程序。埃文斯(Evans)暗示了未來,他說:“我們最近的研究論文突出了未來的創造可能性,從實時音樂的發電到交互式聲音設計,音樂會動態適應觀眾,”引用 py。朝著實時的互動音頻體驗,可以重新定義數字參與。
但是,該行業對濫用的潛力保持謹慎。例如,NVIDIA開發了其先進的Fugatto模型,但到目前為止,NVIDIA的副總裁
Bryan Catanzaro(NVIDIA的副總裁)在當時警告說,任何生成技術總是會帶來一些風險,因為人們可能會使用更多的研究來產生更多的研究,因為我們會更喜歡他們,而不得不反映出一定的p,
高級應用程序。埃文斯(Evans)暗示了未來,他說:“我們最近的研究論文突出了未來的創造可能性,從實時音樂的發電到交互式聲音設計,音樂會動態適應觀眾,”引用 py。朝著實時的互動音頻體驗,可以重新定義數字參與。