YouTube正在將其多語言音頻功能擴展到數百萬創作者,使他們可以在視頻中添加配音音軌。 The move aims to help creators reach a wider global audience by breaking down language barriers.

First piloted in 2023 with creators like MrBeast, the tool’s full rollout intensifies the AI translation arms race.

It follows recent launches from Meta, which debuted an AI dubbing and lip-syncing tool for Reels in August, and Google’s own integration of Gemini AI for live Google Meet中的翻譯。隨著平台增長在主要市場的放緩,攻入非英語的聽眾對於擴張至關重要。 YouTube的舉動是直接發揮,可以通過為他們提供工具以指數級擴展受眾群。

從飛行員成功到全球推出

擴展該功能的決定遵循了一項非常成功的兩年飛行員。在此階段,YouTube發現,上載了稱為音軌的創作者平均而言,在25%的觀看時間中,他們的觀看時間中有25%的時間來自觀眾的更多參與者。例如,廚師傑米·奧利弗(Jamie Oliver)的頻道在實施多語言音頻後將其觀點增加了兩倍。創作者馬克·羅伯(Mark Rober)現在平均每次視頻使用30多種語言,並同時吸引從首爾到聖保羅的粉絲。

[嵌入式內容]

創建者工具和AI驅動的配音

,YouTube提供了支持創建者的全球拋量,YouTube提供了強大的工具。他們可以手動上傳自己的預譯音軌,以最大程度地控制。這種靈活性對於專業生產工作流程至關重要,並確保語言準確性。

雖然AI驅動的工具提供了便利,但手動上傳選項仍然至關重要。它迎合了與專業翻譯服務合作的創作者,確保了腳本或藝術敏感內容的高保真配音。這種雙重方法允許YouTube為休閒和高生產創建者提供服務。

對於那些尋求更自動解決方案的人,YouTube已集成了AI驅動的自動修補工具。該系統利用Google的雙子座技術不僅可以翻譯內容,還可以復制創作者的原始音調和情感交付。

超越音頻,該平台還正在測試多語言的縮略圖。此功能使創建者可以顯示與觀眾首選語言相匹配的本地化縮略圖文本,進一步個性化國際觀眾的體驗。

AI翻譯武器競賽升溫

YouTube的宣佈在與其他技術巨頭的宣布中,他們正在與其他正在積極地開發自己的AI IMI翻譯技術。這場戰鬥不僅是關於言語的,而且是關於捕捉人類交流的細微差別。

核心技術挑戰在於超越文字翻譯。維護演講者獨特的聲音身份-他們的節奏,情感變形和個性-是下一個領域。掌握這一點的公司將具有重要的優勢,因為真實性對於創造者的知名關係至關重要。

Meta於8月推出的Facebook和Instagram Reels的工具,專注於與短形式的視頻無縫集成,包括可選的Lip-sync功能,包括一個使配音更加自然的。在那裡有潛在的觀眾不一定會說相同語言的令人驚嘆的創作者。 ”

Microsoft在2024年末以其解釋器的功能進入了Fray,該功能旨在克隆用戶的聲音,以進行實時會議翻譯。 

與此同時,Google還利用其在Google Meet中的強大雙子座AI來提供實時的語音翻譯,以保留演講者獨特的節奏和音調。在擁擠的市場中,這種對聲音細微差別的關注被視為主要區別。

即使是專業公司也在迅速創新。翻譯公司Deepl於2024年11月發起了Deepl聲音,。

對於觀眾來說,這種轉變有望獲得更容易訪問的內容體驗,從而消除了字幕的摩擦。但是,這也提出了有關透明度和虛假陳述的潛力的問題。平台正在通過將標籤添加到AI翻譯內容中來導航,這是維持用戶信任的關鍵步驟。

最終,YouTube及其競爭對手對AI Dubbing工具的廣泛推出標誌著數字媒體的關鍵時刻。它有望創建一個更具相互聯繫的全球創作者社區,但也將巨大的權力集中在控制基礎AI的平台的手中,重塑瞭如何生產和消費內容。