DeepSeek R1模型發布後,Meta的AI團隊面臨著巨大的壓力,該模型以前所未有的效率和性能挑戰了AI行業。

專業網路平台Blind 上的匿名貼文揭示了Meta 隊伍內部的混亂,工程師們描述了他們瘋狂地努力理解和複製DeepSeek 的成功,同時努力解決內部效率低下和領導失誤的問題。

Blind是一個匿名的專業社交平台,員工可以在其中分享資訊、討論工作場所問題以及與相同或不同行業的同行建立聯繫。它有一個驗證系統,以確保用戶是他們聲稱工作的公司的實際員工,並且主要受到科技行業專業人士的歡迎,但也滿足各個行業的員工的需求。 height=”707″src=”data:image/gif;base64,R0lGODlhAQABAAAAACH5BAEKAAEALAAAAAABAAEAAAICTAEAOw==”>

相關: DeepSeek R1 如何在製裁下超越ChatGPT o1,重新定義人工智慧效率2,048 個人工智慧效率GPU

一位匿名Meta 員工,發文在「ngi」這個名稱下,」Meta 的GenAI 部門內部的情緒總結如下:

「它始於DeepSeek V3 [2024 年12 月發布的DeepSeek 模型],它使Llama 4 在基準測試中已經落後。

我一點也不誇張。管理階層擔心 GenAI 組織的巨額成本是否合理。當GenAI 組織的每一位“領導者”的收入都超過了訓練DeepSeek V3 的成本時,他們將如何面對領導層,而我們有數十個這樣的“領導者”,DeepSeek R1 讓事情變得更可怕。意義的創新。 > LLaMA AI 受到攻擊– Meta 沒有告訴您有關「開源」的內容模型

DeepSeek R1 給美國科技界帶來衝擊

DeepSeek 於2025年1 月10 日發布的R1 模型顛覆了全球人工智慧格局,它表明:高性能模型的開發成本僅為此類專案的一小部分。

根據2024 年12 月發布的一份研究論文,DeepSeek 工程師使用Nvidia H800 GPU(受美國出口管制限制的低階晶片)訓練模型的成本不到600 萬美元。 p>這些為了遵守美國制裁而故意限制 GPU 帶來了獨特的挑戰,但 DeepSeek 的優化技術使團隊能夠實現與行業領先模型相當的性能。

R1 的基準測試包括在MATH-500 上得分為97.3%,在AIME 2024 上得分為79.8%,使其躋身世界上最強大的人工智慧系統之列。

DeepSeek 的效率R1的表現也部分優於OpenAI的o1模型,不僅動搖了人們對Meta等美國科技巨頭的信心,也引發了重大的市場反應。

該模型發布後,英偉達股價在盤前交易中下跌超過 13%,納斯達克 100 指數期貨下跌超過 5%。同時,DeepSeek 已攀升至Apple 美國應用程式商店下載量榜首,下載量超過OpenAI 的ChatGPT。 wp-content/uploads/2025/01/NVIDIA-20250127-pre-trading-1024×707.jpg”>

Meta 工程師質疑對昂貴的計算AI 培訓的依賴

在Meta 中,工程師批評該公司依賴殘酷的運算能力,而不是追求效率驅動的創新。

一名員工在Blind 上評論道:很多領導層實際上對底層技術一無所知(甚至很多工程知識),他們不斷向領導層推銷“更多GPU=勝利”。另一位員工分享道對「追求影響力」的文化感到沮喪,將其描述為一場晉升競賽,而不是對有意義的進步的承諾。與競爭對手相比缺乏敏捷性而面臨審查。 DeepSeek 的 R1 模型不僅具有成本效益,而且是開源的,允許世界各地的開發人員檢查和建立其架構。

盲人討論也揭示了更廣泛的行業擔憂。谷歌員工承認 DeepSeek 的顛覆性影響,其中一位員工指出:「DeepSeek 所做的事情確實很瘋狂。不僅僅是 Meta,他們也在 OpenAI、Google 和 Anthropic 的屁股下點燃了火。這是一件好事,我們即時看到公開競爭對創新的有效性。開發中佔據主導地位。受益(例如Meta 的PyTorch 和Llama)他們提出了新的想法,並將其建立在其他人的工作之上。設施

形成鮮明對比,Meta一直專注於大規模基礎設施投資。執行長 Mark Zuckerberg 最近宣布,計劃在 2025 年部署超過 130 萬個 GPU,並投資 600-650 億美元用於人工智慧開發。祖克柏在今年稍早的公開聲明中表示:「這是一項巨大的努力,在未來幾年,它將推動我們的核心產品和業務,釋放歷史性創新,並擴大美國的技術領先地位。出口限制的爭論。政策的限制。 。為此,我們需要消耗四倍的運算能力才能達到相同的效果。我們需要做的就是不斷縮小這些差距」。

隨著人工智慧產業努力應對DeepSeek 成功的影響,Meta 面臨著迫切需要適應的問題。該公司的員工已經明確表達了他們的不滿,呼籲目前,DeepSeek 的 R1 模型是資源工程的有力證明,正在重塑全球人工智慧發展的競爭動態。

Categories: IT Info