來自HKUST和M-A-P的一組研究人員發布了Yue,這是一個由開源AI模型的家族,能夠從文本歌詞中產生全長的五分鐘歌曲。與a 有關arXiv 的技術論文,Yue進入了一個面臨強烈法律審查的行業。

yue是可通過github 在允許的 apache 2.0許可證下。此舉旨在促進AI音樂創作中的透明創新,為藝術家和開發人員提供一個有力的,合法的替代方案。研究人員將其歸因於其 paper

一個關鍵技術是“軌道-結束的次要預測”。這使模型可以作為單獨的平行流處理人聲和伴奏。這樣可以防止在金屬等流派中常見的密集儀器段壓倒性和扭曲人聲曲目,從而確保抒情的清晰度。

保持長期連貫性,YUE採用“結構性漸進調節”。通過將歌曲分解為[經文]和[合唱]等邏輯片段,該模型著重於在轉移到下一個之前的每個部分內保持旋律的一致性,從而防止了長序列上的質量降解。

該模型還展示了複雜的內在學習(ICL)能力。用戶可以提供一個簡短的音頻剪輯來指導樣式,從而實現高保真的語音克隆和流派彎曲樣式轉移。 官方演示頁具有未經明確培訓的高級聲音技術的令人印象深刻的示例Field

yue的首次亮相是隨著AI音樂世界與基本法律問題的努力。 2024年6月,RIAA通過起訴Suno和Udio侵犯了大規模版權,從而升級了衝突。 RIAA董事長兼首席執行官Mitch Glazier警告說:“像Suno和Udio這樣的無執照的服務聲稱複製藝術家一生的工作是“公平的”……為我們所有人提供了真正創新的AI的承諾。 規模。”兩家公司都以“合理使用”學說為自己的技術辯護,Suno首席執行官Mikey Shulman聲稱自己的模型是“……旨在產生全新的成果,而不是為了記憶和反駁現有的內容。在這種不確定性中,其他玩家正在繪製更謹慎的課程。 Voice AI初創公司ElevenLabs最近推出了自己的工具,即“駕照優先”策略的11音樂。首席執行官Mati Staniszewski強調,“該模型嚴格創建在我們可以訪問的數據上。 ”

AI音樂大戰:訴訟和許可證的景觀

創新和智力財產權之間的張力定義了當前的AI音樂界面。該行業在如何進行方面仍然有著深刻的分歧,迫使平台和科技公司仔細選擇其策略。

科技巨頭正在仔細踩踏。 Google的音樂AI沙盒水印均可確保可追溯性。 Nvidia採取了更加保守的一步,推出了其強大的Fugatto音頻模型,但扣留了公眾發布。公司副總裁布萊恩·卡坦扎羅(Bryan Catanzaro)指出:“任何生成技術總是會帶來一些風險,因為人們可能會使用它來產生我們寧願不喜歡的東西。 ”

流媒體平台也在繪製線路。 Spotify證實這將允許AI音樂,但警察未經授權的語音模仿,而環球音樂和賽策賽則先前宣布了一種“以藝術家為中心的”模型,以優先考慮版稅計算中的人類創作者。

這一警告反映了創意社區中更廣泛的焦慮。儘管一些藝術家將AI作為一種協作工具,但其他藝術家則擔心它會貶值人類的藝術性。作者喬安娜·馬西耶夫斯卡(Joanna Maciejewska)捕捉了這種情緒,他說:“我希望阿爾(Al)做我的洗衣和菜餚,以便我可以做藝術和寫作,而不是為了做我的藝術和寫作,以便我可以做我的洗衣和菜餚。 target=“ _ blank”>開源工具,其創建者正在刻意聲明。他們敢打賭,透明度和社區驅動的發展,而不是封閉的訴訟,最終將定義音樂中AI的未來。

Categories: IT Info