OpenAI 的研究人員過早慶祝 GPT-5 的重大數學突破,上週末在社交媒體上引發了強烈反對。在 X 上一系列現已刪除的帖子中,幾位研究人員聲稱先進模型已經解決了著名的 Erdős 問題。
然而,當數學家公開糾正這一記錄時,勝利的一圈被縮短了。他們澄清說,GPT-5 並沒有產生新穎的解決方案,而是發現了研究人員不知道的現有學術論文。這一令人尷尬的逆轉招致了行業競爭對手的尖銳批評。
此案突顯了人工智能領域展示突破性進展的巨大壓力。這也是一個強有力的警示故事,提醒人們不要在這個涉及數十億美元的領域進行肆意的炒作。
錯誤突破與迅速糾正
令人興奮的事情始於 10 月 18 日,當時 OpenAI 副總裁 Kevin Weil 和其他人在 X 上發帖稱,GPT-5 解決了著名數學家 Paul Erdős 提出的 10 個“之前未解決”的問題。
這標誌著生成式 AI 推理能力的巨大飛躍。
Paul Erdős(1913-1996)是一位匈牙利數學家,被譽為 20 世紀數學界最多產和最有影響力的人物之一。他在數論、組合學、圖論、概率論和集合論等不同領域發表了 1,500 多篇研究論文,通常與 500 多名合著者合作。
這些指控幾乎立即就被揭穿了。鄂爾多斯問題網站的運營者、數學家托馬斯·布魯姆公開駁斥了這一消息,稱其為“戲劇性的誤解”。他解釋說,這些問題只是在他的網站上列為“開放”,因為他個人並不知道現有的解決方案。
Bloom 澄清說,GPT-5 的真正成就是進行了複雜的文獻搜索。他指出,“GPT-5 找到了解決這些問題的參考資料,而我個人卻沒有意識到。”該模型充當的是研究助理,而不是開創性的數學家。最初的聳人聽聞的聲明很快被刪除或修改。
嗨,作為 https://t.co/69gOJM7Ci7 的所有者/維護者,這是一個戲劇性的失實陳述。 GPT-5 找到了參考資料,它解決了我個人不知道的這些問題。
“開放”狀態僅意味著我個人不知道解決該問題的論文。
— Thomas Bloom (@thomasfbloom) 2025 年 10 月 17 日
競爭對手猛烈抨擊“令人尷尬的”公開失誤
公開失誤為 OpenAI 的競爭對手提供了充足的彈藥。在競爭激烈的人工智能領域,來自競爭對手的迅速公開譴責並不奇怪。
Google、Meta 和 OpenAI 陷入了人才、企業客戶和公眾認知的爭奪戰。
Google DeepMind 首席執行官 Demis Hassabis 對 X 做出了直率的評價,簡單地說,“這很尷尬。”
這是 尷尬
——Demis Hassabis (@demishassabis) 10 月 18 日, 2025
他的公司最近將 OpenAI 與自己的一項合法數學成就相匹配。
Meta 的首席人工智能科學家 Yann LeCun 的批評更為尖銳。他暗示 OpenAI 已成為其自身營銷的受害者,並打趣說該公司“被他們自己的 GPTards 抬高了”。 這一事件講述了一個處於壓力之下且容易粗心大意的組織。
強烈反對後,包括 Sebastien Bubeck 在內的 OpenAI 研究人員刪除或撤回了他們最初的慶祝帖子。
我刪除了該帖子,我顯然無意誤導任何人,我認為措辭很清楚,對此感到抱歉。僅找到文獻中的解決方案就是這樣,我發現這非常加速,因為我知道搜索文獻有多麼困難。
— Sebastien Bubeck (@SebastienBubeck) 2025 年 10 月 18 日
雖然 Bubeck 為該模型辯護說:“我知道搜索 文學”,損害已經造成。勝利的語氣已被防禦性的語氣所取代。
炒作與現實:人工智能在數學中的真正作用
這一集是人工智能炒作週期的教科書示例,其中技術的前景可能超過其當前的能力。
分析師長期以來一直警告說,生成人工智能領域是接近“幻滅的低谷”,因為崇高的承諾遇到了現實世界的限制。