埃隆·馬斯克 (Elon Musk) 的 xAI 與 Nvidia 員工一起加入人工智能世界模特大賽

埃隆·馬斯克 (Elon Musk) 的人工智能初創公司 xAI 正在通過聘請芯片巨頭 Nvidia 的關鍵專家來加速其現實模擬“世界模型”的開發。

根據報告，該公司在夏天聘請了人工智能研究人員 Zeeshan Patel 和 Ethan He，這標誌著在即將成為下一個主要人工智能領域的行業領導者面臨直接挑戰

這一戰略推動凸顯了世界模型（能夠理解和預測物理環境的先進人工智能）日益增長的重要性。對於馬斯克和他的競爭對手來說，掌握這項技術是為機器人、遊戲以及最終的通用人工智能 (AGI) 創建更強大的人工智能的關鍵一步。

此舉也加深了兩家公司之間的聯繫。 Nvidia 不僅是人才來源，也是 xAI 的堅定投資者，首席執行官黃仁勳最近證實了這一事實。這一聯盟凸顯了構建這些複雜模型所需的巨大計算資源。

xAI 與 Nvidia 人才和投資展開競爭

雖然 xAI 以其 Grok 聊天機器人而聞名，但這一新舉措標誌著語言模型之外的重大擴展。 Nvidia 是模擬領域的領導者，擁有 Omniverse 平台，從 Nvidia 聘請人才明確表明了其意圖構建能夠理解 3D 空間（而不僅僅是文本）並與之交互的 AI。

xAI 的雄心並不純粹是學術性的。馬斯克公開表示，公司的目標是在明年年底前發布一款“出色的人工智能生成遊戲”。這一積極的時間表表明 xAI 專注於將尖端研究轉化為有形產品，這可能會擾亂互動娛樂行業。

為了實現這一目標，該公司正在建立一個專注於人工智能係統的“全能團隊”，該系統可以理解和生成各種格式的內容，包括照片、視頻和音頻。 Patel 的工作重點是生成模型和 3D 視覺，其招聘直接符合這種多模式戰略。

世界模型代表了人工智能開發的根本性轉變。他們不僅僅處理數據，還構建了現實的內部模擬，使他們能夠預測行動將如何在物理空間中發揮作用。這種能力被視為人工智能未來的基石。

與依賴硬編碼規則的傳統物理引擎不同，這些模型通過分析大量視頻數據來學習對現實的直觀把握。正如 IBM 研究中心主任 Juan Bernabé-Moreno 所解釋的那樣，“世界模型允許機器在模擬空間中規劃運動和交互，通常稱為‘數字孿生’，然後再在物理世界中進行嘗試。”

這種“數字孿生”方法允許人工智能在安全的虛擬環境中從試錯中學習，從而極大地加速諸如機器人和自主導航。

這就是為什麼該領域的許多人認為世界模型對於實現 AGI 至關重要。 DeepMind 的研究科學家 Jack Parker-Holder 強調了這一點，他表示:“我們認為世界模型是通向 AGI 的關鍵，特別是對於實體智能體而言，模擬現實世界場景尤其具有挑戰性。”

xAI 正在進入一個競爭激烈的舞台。 Google DeepMind 一直是主導力量，於 2025 年初正式成立了專門的世界模型團隊。該團隊的負責人 Tim Brooks 宣布，“DeepMind 制定了雄心勃勃的計劃，要製作模擬世界的大規模生成模型”，這表明了該公司的重大承諾。

DeepMind 的技術發展迅速。其於 2024 年末發布的早期 Genie 2 模型只能維持約 20 秒的模擬。它的繼任者 Genie 3 於 2025 年 8 月推出，代表著巨大的飛躍，可以生成幾分鐘的交互式 3D 世界，甚至允許通過文本提示進行實時更改。

Meta 還通過 V-JEPA 2 表明了自己的主張，這是一個開源模型，旨在通過視頻學習來賦予機器人物理常識。與此同時，中國科技巨頭騰訊發布了HunyuanWorld-Voyager，它可以從單個圖像創建可探索的3D世界，並在行業基準測試中表現出強勁的性能。

儘管進展迅速，但該技術仍處於早期階段。研究人員承認，在可靠部署這些模型之前仍然存在重大障礙。主要挑戰包括延長模擬持續時間並確保人工智能的動作在物理上準確且安全。

當前的模型還難以完成特定任務，例如準確渲染文本或模擬多個獨立代理之間的複雜交互。谷歌 DeepMind 研究總監 Shlomi Fruchter 警告說，“在將模型部署到現實世界之前，必鬚髮生很多事情，但我們確實將其視為更有效地訓練模型並提高其可靠性的一種方法。”

世界模型的開發是一場馬拉松，而不是短跑。它需要對人才、數據和計算能力進行大量投資。在 Nvidia 的支持和埃隆·馬斯克 (Elon Musk) 的願景下，xAI 現在已成為構建人工智能未來的高風險競賽中的強大競爭者。