Google在Google I/O 2025會議期間宣布了Mariner Project Project對Project Project宣布更廣泛的推出和關鍵更新。該實驗性AI旨在代表用戶瀏覽網站並與網站進行交互,現在可以使用基於雲的虛擬機操作,並且最多可以同時管理十個任務。這一發展標誌著Google強烈推動了重塑網絡互動的推動力,授權AI積極執行任務,這一舉動可能從根本上改變了用戶和企業與Internet的互動方式。

最初,在Google新的249.99美元的AI Ultra Plan Plans的美國訂閱者中,Project Mariner可以使用Project Mariner,並為更快的國家提供了支持。對於開發人員來說,Google將項目Mariner的功能集成到Gemini API和Vertex AI中,今年夏天預計會有更廣泛的可用性。

此集成將提供創建更多自主數字體驗的工具,從購買門票到無直接網站訪問的訂購雜貨。測試夥伴在任何地方和UIPATH等測試夥伴都已經在使用這些功能來構建解決方案。瀏覽器,然後理由解釋目標,制定計劃並採取行動。這涉及識別和理解各種網絡元素,例如文本,代碼,圖像和表格,以建立對屏幕上內容的全面理解。單個演示後,“教學和重複”系統進一步允許AI學習任務。

增強功能和用戶體驗

項目水手項目的關鍵升級是其過渡到雲中虛擬機上運行的過渡。這使AI代理可以在用戶繼續進行其他工作的同時完成後台完成任務,這是其前身的顯著改進,直接在用戶的瀏覽器上運行和有限的並發活動。 Google指出,新的迭代最多可以立即處理十個任務,這是效率的實質性提高。

[嵌入式內容]

用戶最終將能夠通過Google Search上的AI模式訪問Project Mariner,最初是通過搜索實驗室通過搜索示範顯示AI模式,以迅速查找和保留棒球遊戲票。 Google正在與Ticketmaster,StubHub,Resy和Vavaro等合作夥伴合作,以促進其中一些以代理驅動的交互。

與此相關,Google還展示了Gemini App中的“代理模式”的早期版本。 Google將代理模式描述為一個系統,用戶可以簡單地陳述其目標,然後Gemini將“智能協調實現目標的步驟”。

公司進一步解釋說,Agent Mode集成了高級功能,例如實時Web瀏覽,研究和應用程序集成,以將復雜的任務與最少的用戶監督一起管理複雜的任務。 (Google在

瀏覽競爭性的AI代理景觀

Google的項目Mariner進入了AI驅動的自動化的競爭日益激烈的領域。 Openai在2025年2月擴大了對Chatgpt Pro用戶的AI代理,運營商的訪問,允許自動化數字工作流程,儘管操作員需要在執行操作之前明確的用戶批准。 微軟還於2025年4月在其Copilot Studio中預覽了針對企業自動化的“計算機使用”功能。

ANTHROPIC也是關鍵人物,在2024年10月升級其Claude 3.5 SONNET模型,該模型允許其管理桌面任務。這些工具,包括亞馬遜的NOVA法案,主要是在實驗階段,並且早期的經驗有時會發現它們很慢或容易出現錯誤。 Project Mariner與Gemini的代理模式集成在一起,利用了先進的視覺語言模型來解釋視覺元素,這是一個關鍵的差異化。

績效現實和更廣泛的AI策略

儘管有迅速的進步,但儘管有迅速的進步,但當前AI代理在自動處理複雜的專業人士中的實際效率仍然存在,但仍在越來越多。卡內基梅隆大學的一項研究對AI代理能力進行了清醒的評估。

該研究發現,即使領導AI也完全完成了24%的分配任務。研究人員指出,諸如“缺乏常識,社交技能差和網絡瀏覽中的無能”等問題,得出的結論是,儘管AI代理人可以提供幫助,但它們“可能不是目前所有任務的替代者”。 2025年5月初的報告表明,Google正在其AI工作室中測試“計算機使用”功能,並可能與其Gemma 3型號鏈接並簡化了Cloud Run部署。這與Google Cloud的更廣泛的策略相吻合,該策略將多代理AI系統稱為“下一個邊界”。

Google首席執行官Sundar Pichai強調了這一願景,將代理描述為“將高級AI的智能結合在一起,可以將AI模型的智能與您的工具訪問,因此它們可以按您的控制和在Google In Conge Inder Inder Inder Inder Inder Inder google I/O中採取行動。”隨著Google繼續開發這些代理技術,它們的成功不僅將取決於技術實力,而且還可以解決可靠性,安全性和現實世界任務自動化的細微挑戰。

Categories: IT Info