Google製作了最先進的AI型號Gemini 2.5 Pro(實驗),可用於免費的Gemini Web應用程序的所有用戶,宣稱替換了較舊版本並刪除了以前的付費牆。

更新開始於3月29日推出,沒有正式的博客文章或新聞稿。取而代之的是,用戶注意到Gemini Web應用程序本身的更改,其中響應現在歸因於某些默認值的“ Gemini 2.5 Pro(EXP)”。自由用戶現在可以通過模型選擇器選擇Gemini 2.5 Pro。

公司後來確認了X上的推出,寫道:“團隊正在衝刺,TPU正在運行熱,我們希望盡快將我們最聰明的模型納入更多人的手中。”這種緊迫性指出了戰略的轉變- Google不再將其頂級AI限制在付費牆後面,而是將其推向所有人。

“>

gemini 2.5 Pro正在脫離🚀🚀🚀

團隊正在衝刺,TPU正在運行熱,我們想盡快將我們最聰明的模型放到更多的人中。

。 href=“ https://t.co/eqccjwwvhxj” target=“ _blank”> https://t.co/eqcccccccjwwvhxj

– Google gemini app(@geminiapp) href=“ https://twitter.com/geminiapp/status/1906131622736679332?

僅在五天前,即3月25日,Gemini 2.5 Pro專門用於支付Gemini Advanced和Google AI Studio的用戶的訂戶。該版本首先僅限於$ 19.99/月Google One AI高級計劃。到本週末,同一模型的實驗版本成為使用Gemini應用程序的每個人的默認版本,包括在自由層上的應用程序。

這種突然的擴展提出了多種動機:縮放採用,加速反饋週期以及將雙子座定位為真正的競爭者,將gemini作為openai,Openai,Anthropic和Xai的模型。它還反映了對模型的性能和現實世界準備的信心,即使以實驗形式也是如此。

以推理為中心的模型具有新的權衡

gemini 2.5 Pro的最大變化在於它的思維方式。與依靠單通行預測的傳統生成模型不同,該模型執行多步邏輯驗證以增強其推理。 

該大型上下文窗口使雙子座能夠一次處理整個書籍,法律合同或代碼庫。在測試長期含量的MRCR 128K基準測試中,雙子座的精度達到了91.5%的準確性,並保持了83.1%的績效,並以全面的比例保持了83.1%的績效,這相當明顯地領先於GPT-4.5的36.3%。

Google的模型在科學推理中也高度排名,在GPQA Diaond Marks上排名84%,在lmarena排行榜上近40分。對於涉及文本和圖像的多模式任務,它在MMMU基準測試中得分為81.7%-在Claude 3.7 SONNEN和GPT-4.5。 Gemini在SimpleQA上得分52.9%,這是一項事實召回測試,落後於GPT-4.5的62.5%。在自動軟件工程方案(代理編碼)中,克勞德3.7十四行詩仍以70.3%的領先優勢,而Gemini Trails則為63.8%。

來源: Google

開發人員工具和多模式功能

,而OpenAI的O3-Mini高線在現場代碼生成中(在Livecodebench上為74.1%),Gemini 2.5 Pro以70.4%的速度持有自己的自身。它在代碼編輯任務中的表現更好。在Aider Polyglot基準測試(設計多種語言代碼修改)上,Gemini得分為74.0%,將Claude和DeepSeek的最新型號淘汰。

gemini對多模態輸入的天然支持意味著可以處理同一查詢中的圖像,視頻,代碼和文本。該功能擴展到Gemini Live之類的工具,該工具允許屏幕和基於相機的幫助。 Google還將Gemini集成到了諸如Gmail,Docs和Drive之類的工作空間工具中-提供智能摘要,電子郵件搜索增強功能和文檔導航輔助工具。

Android Tavover和用戶響應

gemini的擴展超出了改進的模型。它還代替了Google Assistant作為Android設備上的默認語音AI。變化引起了混雜的反應。一些用戶讚揚了雙子座在編碼和研究等任務中的表現。

其他人批評了這一轉變,並引用了缺少的助手功能和較不直觀的語音交互。

同時,Google使Gemini的AI AI功能更易於訪問,包括Gmail和Docs,包括Gmail和Docs。 Gemini還將搜索歷史記錄在個性化的響應中-對AI和傳統搜索之間的未來重疊。 該策略是否有效取決於用戶的響應方式。

Categories: IT Info