OpenAI 的研究人員過早慶祝 GPT-5 的重大數學突破,上週末在社交媒體上引發了強烈反對。在 X 上一系列現已刪除的帖子中,幾位研究人員聲稱先進模型已經解決了著名的 Erdős 問題。

然而,當數學家公開糾正這一記錄時,勝利的一圈被縮短了。他們澄清說,GPT-5 並沒有產生新穎的解決方案,而是發現了研究人員不知道的現有學術論文。這一令人尷尬的逆轉招致了行業競爭對手的尖銳批評。

此案突顯了人工智能領域展示突破性進展的巨大壓力。這也是一個強有力的警示故事,提醒人們不要在這個涉及數十億美元的領域進行肆意的炒作。

錯誤突破與迅速糾正

令人興奮的事情始於 10 月 18 日,當時 OpenAI 副總裁 Kevin Weil 和其他人在 X 上發帖稱,GPT-5 解決了著名數學家 Paul Erdős 提出的 10 個“之前未解決”的問題。

這標誌著生成式 AI 推理能力的巨大飛躍。

Paul Erdős(1913-1996)是一位匈牙利數學家,被譽為 20 世紀數學界最多產和最有影響力的人物之一。他在數論、組合學、圖論、概率論和集合論等不同領域發表了 1,500 多篇研究論文,通常與 500 多名合著者合作。 

這些指控幾乎立即就被揭穿了。鄂爾多斯問題網站的運營者、數學家托馬斯·布魯姆公開駁斥了這一消息,稱其為“戲劇性的誤解”。他解釋說,這些問題只是在他的網站上列為“開放”,因為他個人並不知道現有的解決方案。

Bloom 澄清說,GPT-5 的真正成就是進行了複雜的文獻搜索。他指出,“GPT-5 找到了解決這些問題的參考資料,而我個人卻沒有意識到。”該模型充當的是研究助理,而不是開創性的數學家。最初的聳人聽聞的聲明很快被刪除或修改。

嗨,作為 https://t.co/69gOJM7Ci7 的所有者/維護者,這是一個戲劇性的失實陳述。 GPT-5 找到了參考資料,它解決了我個人不知道的這些問題。

“開放”狀態僅意味著我個人不知道解決該問題的論文。

— Thomas Bloom (@thomasfbloom) 2025 年 10 月 17 日

競爭對手猛烈抨擊“令人尷尬的”公開失誤

公開失誤為 OpenAI 的競爭對手提供了充足的彈藥。在競爭激烈的人工智能領域,來自競爭對手的迅速公開譴責並不奇怪。

Google、Meta 和 OpenAI 陷入了人才、企業客戶和公眾認知的爭奪戰。

Google DeepMind 首席執行官 Demis Hassabis 對 X 做出了直率的評價,簡單地說,“這很尷尬。”

這是 尷尬

——Demis Hassabis (@demishassabis) 10 月 18 日, 2025

他的公司最近將 OpenAI 與自己的一項合法數學成就相匹配。

Meta 的首席人工智能科學家 Yann LeCun 的批評更為尖銳。他暗示 OpenAI 已成為其自身營銷的受害者,並打趣說該公司“被他們自己的 GPTards 抬高了”。 這一事件講述了一個處於壓力之下且容易粗心大意的組織。

強烈反對後,包括 Sebastien Bubeck 在內的 OpenAI 研究人員刪除或撤回了他們最初的慶祝帖子。

我刪除了該帖子,我顯然無意誤導任何人,我認為措辭很清楚,對此感到抱歉。僅找到文獻中的解決方案就是這樣,我發現這非常加速,因為我知道搜索文獻有多麼困難。

— Sebastien Bubeck (@SebastienBubeck) 2025 年 10 月 18 日

雖然 Bubeck 為該模型辯護說:“我知道搜索 文學”,損害已經造成。勝利的語氣已被防禦性的語氣所取代。

炒作與現實:人工智能在數學中的真正作用

這一集是人工智能炒作週期的教科書示例,其中技術的前景可能超過其當前的能力。

分析師長期以來一直警告說,生成人工智能領域是接近“幻滅的低谷”,因為崇高的承諾遇到了現實世界的限制。

這種壓力不是在真空中發生的。幾個月來,OpenAI 一直在經歷一段內部動盪時期,該公司一直在努力維持其堅定領導地位的公開形象。該公司需要塑造一個不斷創新的形象,以維持其地位。

具有諷刺意味的是,這一錯誤與 OpenAI 最近在數學領域真正的成功形成了鮮明對比。今年 7 月,該公司宣布其實驗模型在國際數學奧林匹克競賽中獲得金牌,這是一項需要創造性和嚴格證明的壯舉。

這一成就證明了人工智能推理的真正飛躍,這使得隨後在 Erdős 問題上出現的非受迫性錯誤更加令人費解。看來宣布下一件大事的壓力導致了基本驗證的失敗。

儘管有令人尷尬的誇大,但該事件確實凸顯了 GPT-5 的實用性。正如著名數學家陶哲軒所指出的,人工智能最直接的潛力不是解決最棘手的開放問題。

相反,他認為“生成式人工智能可以幫助數學‘工業化’並加速該領域的進步。”通過有效地找到晦澀的論文,GPT-5 完美地證明了這一點。

在 Mastodon 上查看

該事件最終對整個行業來說是一個重要的提醒。隨著人工智能模型變得越來越強大,嚴格的科學驗證的需求變得比以往任何時候都更加重要。在通用人工智能的高風險競賽中,了解正確的事實與構建技術本身同樣重要。

Categories: IT Info