Google announced an updated version of its Gemini 2.5 Pro artificial intelligence model today, branding it the “I/O Edition”and highlighting substantially improved coding abilities.

Citing “壓倒性的熱情”,該公司在Google I/O會議上計劃的首次亮相之前發布了更新,使其通過Gemini API和麵向消費者的Gemini App立即提供。 Google I/O定於5月20日至21日在加利福尼亞山景城的海岸線露天劇場舉行,主要主題演講定於下午10點/下午1點。 ET在第一天。

此“ I/O版”,被標識為版本Gemini-2.5-Pro-Proview-05-06,旨在在與編碼相關的任務中提供明顯的一步。 Google強調了在轉換現有代碼,編輯代碼庫和構建複雜的多步代理工作流程等領域的進步。該公司特別指出,在前端和用戶界面開發中的性能更好。

WebDev競技場排行榜,一個基準測量了人類對AI生成的Web應用程序的偏愛,據報導,它在以前持有#2的#2之後超過了先前的#1 Elo點。 Further metrics shared by Google include an improvement in the LiveCodeBench v5 code generation test, where its score rose from 70.4% (as reported for the previous Gemini 2.5 Pro version) to 75.6%.

[embedded content]

Enhanced Coding and Developer Feedback

Google frames the “I/O Edition”as a strategic move to make advanced AI coding tools more在會議上預期的更大平台更新之前,開發人員可以訪問。

Google的公告包括行業合作夥伴的認可。 “我們發現Gemini 2.5 Pro在’與潛伏期的能力上是最佳的邊界模型,” Replit的總裁Michele Cattasta表示。

[嵌入式內容]

使用更新模型的開發人員也有望在功能調用和改善觸發率方面遇到較少的錯誤。 Verge指出的早期動手印象表明,這種改進的功能稱呼更複雜,多轉向的對話編碼任務,其可靠性比3月的預覽更高。

超越代碼生成,“ I/O版”在視頻理解中保持強勁的性能,在Videmomme Benchmark上得分為84.8%。 Google通過詳細介紹了在Google AI工作室中學習更多功能的視頻視頻。

[embedded content]

Other examples of its application include the Gemini 95 starter app, where the model can assist in adding new features like a video player while adhering to the existing application style, and a新的概念啟動器應用程序展示了該模型生成功能代碼和美學UI元素的能力,包括動畫。

代碼生成的能力

gemini 2.5 pro模型構建在構建的混合物(MOE)構造的prectuctiation pros

它們具有100萬個令牌上下文窗口,使他們能夠處理整個書籍或代碼庫等廣泛的輸入。該體系結構還支持本機多模式功能,處理文本,圖像,視頻和代碼。

gemini 2.5 Pro顯示出強大的能力理解引用的PDF佈局,Google自己的文檔警告說,“ _ black”>“空間推理” 仍然是一個限制,指出“在pd of pd of” Gemini 2.5 Pro於3月25日向訂戶介紹,並將其隨後從3月29日開始向所有自由用戶進行快速推出。該較早版本已經顯示出數學的出色性能(AIME 2024的92.0%)和多模式任務(MMM u上的81.7%),儘管它也顯示了滯後競爭者在當時落後的區域。該模型的知識截止時間保留了2025年1月,根據其型號型號。 2.5系列並非沒有審查,尤其是關於安全文件的時間。 Gemini 2.5 Pro的初始型號卡在其廣泛的公眾可用性後幾週左右發布。

這導致了民主技術中心的AI治理專家(如Kevin Bankston)的批評,他們稱文檔為“微薄” ,並擔心“在公司將模型趕到市場上的AI安全性和透明度上的局限性。該模型卡提到了內部安全審查和緩解,它缺乏紅色團隊等測試的具體結果。 While the WebDev Arena success is notable, some AI researchers, according to MIT Technology Review, have pointed out the ongoing need for more diverse and standardized benchmarks for “agentic coding workflows”to comprehensively assess models in complex software development scenarios.

The “I/O Edition”of Gemini 2.5 Pro is distinct from Gemini 2.5 Flash, a model previewed on April 18, which is tailored for speed and成本效益。 Google還指出了通過Google分佈式雲從第3225季開始的Google分佈式雲的本地部署的計劃。當前的“ I/O Edition”更新維持 href=“ https://console.cloud.google.com/vertex-ai/studio/multimodal?model=gemini-2.5-pro-pro-pro-preview-05-06″ target=“ _ black”> vertex ai

Categories: IT Info