Google DeepMind揭開了Alphaevolve,這是一種高級AI代理,利用其雙子座模型自主發現和優化複雜算法。 This system is engineered to address fundamental challenges in mathematics and enhance practical computing applications, signifying a notable advancement in AI-driven scientific exploration.

AlphaEvolve’s core innovation is its methodology, which combines the creative code-generation of Gemini Pro for depth and Gemini Flash for breadth with a rigorous automated evaluation system to verify solution quality, all within an evolutionary framework that通過不斷發展整個代碼庫來完善算法。

新的AI代理已經在Google的運營中顯示出顯著的現實影響。 According to Google DeepMind AlphaEvolve improved data center scheduling efficiency, recovering an average of 0.7% of Google’s worldwide compute 資源。它還有助於為未來的TPU(張量處理單元,Google的自定義AI加速器)優化硬件設計,並使雙子座自己的AI模型培訓時間減少了1%。

超出這些內部成就,據說Alphaevolve在理論上是在理論上更加有效的4×4×4×4×4×4非。 Strassen的算法並將解決方案推進了開放問題,例如接吻數問題。

DeepMind Condition Alphaevolve是增強人類專業知識並加速各個領域的科學發現的工具。 The company plans an early access program for selected academic users, with a registration form available for interested parties.

How AlphaEvolve Crafts and Validates Algorithms

AlphaEvolve employs a算法設計的多階段過程。它利用了Google的雙子座模型的合奏:更快的Gemini Flash探索了各種各樣的潛在想法,而更強大的Gemini Pro為實現這些算法解決方案實現這些算法的計算機程序提供了深刻而有見地的建議。

這些生成的程序然後使用客觀地評估每個解決方案的準確性評估每個解決方案的精度和質量的質量。正如Google所說,該驗證是至關重要的,因為Alphaevolve是針對“機器分級”解決方案的問題而設計的。

該系統在進化框架內運行,從過去的嘗試中學習以及迭代地完善最有前途的概念,從而使其通過進化整個代碼庫來開發複雜的算法。但是,TechCrunch還指出了一個關鍵局限性:Alphaevolve只能將解決方案描述為算法,從而使其不適合非數字問題。

有形影響和數學前沿

在Google內部的實踐應用已經實質。它優化了 borg,Google的大型集群管理系統已經在一年中生產了一年。在硬件中,Alphaevolve提出了為關鍵算術電路重寫的Verilog(一種硬件說明語言),將一個更改集成到即將到來的TPU中。

用於AI開發,它加速了至關重要的軟件組件,或者在Gemini的架構中,在Gemini的架構中乘坐23%的架構,並通過33%的gputions for 32. flasteention for 32. flasteention for 39. The company has published a detailed white paper on alphaevolve。

在純數學中,alphaevolve設計了一種新型基於梯度的優化過程的一部分,從而導致了用於矩陣乘法的新算法。 Its improvement on Strassen’s 1969 algorithm for 4×4 complex-valued matrices, using 48 scalar multiplications, surpasses DeepMind’s previous specialized system, AlphaTensor, in this specific area.

When applied to over 50 open mathematical problems, AlphaEvolve rediscovered state-of-the-art solutions in about 75% of cases and improved known solutions in 20%, including for the kissing數字問題。這些數學結果可在a 景觀

alphaevolve繼續進行DeepMind的工作,將AI應用於科學和數學發現,遵循諸如Alphageometry2之類的項目,該項目在解決國際數學奧林匹克問題方面取得了成功,該問題成功地解決了AI Co-Scientient Initiative and Ane Iatiative,以生成研究假設。由大型語言模型提供的代理,用於通用算法發現和優化。 ” DeepMind認為,它在材料科學和藥物發現等領域可能具有變革性。

但是,該系統並非沒有局限性。儘管DeepMind突出了其成功,但TechCrunch觀察到,在某些情況下,Alphaevolve目前在某些情況下以其他工具的確定了一些改進,這表明Alphaevolve目前更具作用為加速器和煉油廠。

,基本的雙子雙子座模型,例如最近更新的Gemini 2.5 Pro,還面臨著關於安全文檔的臨時審查。民主技術中心的凱文·班克斯頓(Kevin Bankston) Gemini 2.5 Pro為“微薄”。

DeepMind自己的先前研究承認:“直到改善模型速度並完全解決了幻覺,符號發動機之類的工具對於數學應用程序仍然至關重要。 ”

>