The race for AI supremacy has reached a new peak, as both Google DeepMind and OpenAI now claim their models can conquer the International Mathematical Olympiad (IMO), one of humanity’s toughest intellectual challenges.

Google announced on Monday that its Gemini Deep Think AI

這一突破表明AI推理具有巨大的飛躍。事實證明,通用模型現在可以在人類精英級別解決複雜的數學問題,從而升級了兩個AI領導者之間的競爭。

競爭性扭曲

Google DeepMind的高級雙子座模型通過“ Deep Think”技術增強,完美地解決了六個異常困難的問題中的五個。它在可能的42分中獲得了35分,在金牌的競賽中,這是第一個由。協調員。 IMO總裁Gregor Dolinar教授證實了這一成就,他指出:“我們可以確認Google DeepMind已達到了備受期待的里程碑,在可能的42分中獲得了35分-金牌得分。他們的解決方案在許多方面都令人驚訝。”但是,IMO的官方聲明僅闡明了

從白銀到黃金:AI推理的飛躍

這一成就代表了上一年的單聲道進步。 In 2024, its systems reached a silver-medal standard but required significant human intervention and specialized tools.

The key innovation this year is the model’s ability to operate end-to-end用自然語言。它處理了正式的問題描述,並直接在嚴格的4.5小時競爭時間限制內直接生成了嚴格的數學證明。

這一飛躍消除了專家的需求,需要將問題轉化為諸如精益的正式語言,例如以前限制系統的速度和自主權。它展示了AI推理的更靈活,更有力的形式。

建立真正的AI數學家

兩家公司都在取得成就,以取得勝利,以贏得通用AI的勝利。 Openai研究員Noam Brown強調:“這不是IMO特定的模型。這是一種推理LLM,結合了新的實驗通用技術,”他的同事們回應了一種情感。這表明,基礎模型具有廣泛的能力,不僅是狹窄的數學專家。

Google的系統依賴於其新的深思熟慮體系結構。這種模式結合了平行的思維,允許該模型一次探索和結合多個潛在的解決方案路徑,而不是追求單個線性的思想鏈。

OpenAI向自我報告的舉動進行自我報告的舉動突出了強烈的壓力,可以表現出領導力,尤其是在內部公司挑戰期間。 For OpenAI, achieving what CEO Sam Altman called a “dream,”“when we first started OpenAI, this was a dream but not one that felt very realistic to us,”serves as a powerful rebuttal to narratives of a company losing its edge.

What This Means for the Future of AI and Science

These advanced reasoning capabilities are still in an experimental phase. OpenAI研究員亞歷山大·韋(Alexander Wei)指出,這項成就代表了“ AI中的長期巨大挑戰”,並補充說:“我很高興分享我們最新的@Openai實驗推理LLM在AI中實現了長期的巨大挑戰:金牌獎牌水平的表現:全球最久partiquigatious的數學競賽中,兩家公司都計劃在Groge Thang of Frested Thang thang thang thang thang thang thang thang thang thang pressight。 DeepMind對下一步表示信心,他說:“我們非常有信心,我們可以很快將[模型]帶入我們值得信賴的測試人員的手中,尤其是數學家。 “目的是將這些工具掌握在數學家的手中,以幫助他們解決更嚴重的問題。

雖然直接的重點是數學,但含義卻更廣泛。可以推定這種創造力和嚴格性的AI可以加速跨科學,工程和研究的發現,從而使我們更接近AGI的最終目標。

Categories: IT Info