Google在周五升級了AI軍備競賽,為高級訂戶推出了Gemini 2.5 Deep Think,其最先進的推理模型。 Deep Think以其每月250美元的Google AI Ultra Plan計劃而亮相,使用了一個“多代理”系統,該系統探索了與解決複雜問題的多個解決方案路徑。

推出遵循了一個戲劇性的一周,谷歌和Rival openai都聲稱征服了具有重要意義的國際國際數學Olympiad(Imo)。此舉展示了Google提高AI至上的努力,在行業收斂於更加計算密集的體系結構時,將其最有力的工具蓋住了。

如何深入思考:具有“平行思維”的多代理系統

的核心,深入思考,以此為代表一個基礎的構造。這是Google的第一個公開可用的多代理AI系統,該設計源於多個AI“代理”同時處理問題。該過程使用了更多的計算資源,但是正如Google解釋的那樣,它允許模型模仿人們如何解決複雜問題:通過探索不同的角度,權衡潛在的解決方案並隨著時間的推移精煉最終答案。

這種“並行思維”方法使模型可以在獲得最終答案之前生成,修改和結合不同的想法。這與傳統的線性AI推理有很大的不同。通過擴展模型的“推理時間”或“思考時間”,Google賦予了它探索更廣泛的假設的能力,並為困難的提示提供了更具創造力和強大的解決方案。

該系統不僅僅是更多的處理時間;這也是關於更智能的培訓。 Google透露,它已經開發了新穎的加固學習技術專門鼓勵該模型更好地利用這些擴展的推理路徑。此外,Deep Think會自動使用代碼執行和Google搜索等工具,並且能夠比以前的模型產生更長的響應。

對於用戶,這轉化為更詳細且周到的輸出。該方法使該模型可以逐步建立一些複雜的作品,從而在Web開發和科學探究等領域提高了美學和功能。正如Google的團隊所說,“深思熟慮可以幫助人們解決需要創造力,戰略計劃並逐步進行改進的問題。 ”

從數學奧林匹克運動會到兩層版本

,發射一周的一周在精英數學上進行了精通數學的挑戰。這場戰鬥始於7月19日Openai搶先宣布的實驗研究模型在

在據報導的內部動盪期間,該公告對公司失去優勢的敘述進行了強有力的技術反駁。 OpenAI researcher Alexander Wei framed it as a major breakthrough, stating, “I’m excited to share that our latest @OpenAI experimental reasoning LLM has achieved a longstanding grand challenge in AI…”His colleague Noam Brown added that “this isn’t an IMO-specific model. It’s a reasoning LLM that incorporates new experimental general-purpose techniques.”

Just two days later, Google responded with its own正式認證的金牌勝利。它的高級雙子座模型通過Deep Think Technology增強了35分。 IMO總裁Gregor Dolinar教授證實了這一成就,他說:“我們可以確認Google DeepMind已經達到了備受疑問的里程碑……他們的解決方案在許多方面都令人驚訝。”這標誌著IMO協調員首次正式對AI的結果進行了正式分級,儘管該組織澄清了它僅驗證了解決方案,而不是系統本身。

這一成就代表了去年Google的績效的紀念性,當時其係統需要大量的人為乾預。關鍵創新是模型能夠以自然語言端到端運行的能力,處理問題描述並直接生成證據,從而消除了專家將問題轉化為正式代碼的需求。

但是,Google正在採取謹慎,兩層的部署方法。完全,計算昂貴的“金牌”版本需要數小時才能推理一個問題-僅與精選的學者和數學家進行研究和反饋。目的是改善產品並探索其增強人類知識的潛力。

[嵌入式內容]

付費訂戶可用的版本是一種更快,更可用的變化,可以實現“青銅級” IMO的性能。該策略強調了Frontier AI的巨大成本,在商業上提供了一個調諧但功能強大的模型,同時保留了最有能力的研究版本。

昂貴,強大的AI

Google的努力的穩定訂閱的人的動作趨於穩定趨勢。隨著AI模型變得越來越強大,它們也變得更加昂貴。 OpenAI和XAI等競爭對手正在開發類似的多代理系統,這些系統也有望將其鎖定在其最昂貴的訂閱層後面。

這種策略為負擔得起的用戶創造了超優化AI的新層。這也反映了高風險的競爭,以主張技術優勢。 Google的基準主張是激進的,深刻的思維勝於Openai的O3和Xai的Grok 4 on Key編碼(LiveCodeBench V6)和知識(人類的最後考試)考試。

發行釋放位置使Google位置在競爭者面對挑戰的時期內大寫。 Openai正在導航內部動盪和強大的開源挑戰者的興起。通過現在啟動深思熟慮,Google正在努力證明其實驗室可以提供下一代AI並定義新的性能前沿。