Ang
Ang Google ay makabuluhang isulong ang mga kakayahan ng ahente ng AI, na nagpapahayag ng isang mas malawak na pag-rollout at pangunahing pag-update sa Project Mariner sa panahon ng Google I/O 2025 Conference. Ang eksperimentong AI na ito, na idinisenyo upang mag-browse at makihalubilo sa mga website sa ngalan ng isang gumagamit, ay nagpapatakbo ngayon sa mga virtual machine na batay sa ulap at maaaring pamahalaan ang hanggang sampung mga gawain nang sabay-sabay. Ang pag-unlad na ito ay nagpapahiwatig ng pinalakas na pagtulak ng Google upang ma-reshape ang pakikipag-ugnay sa web, na nagbibigay kapangyarihan sa AI upang aktibong magsagawa ng mga gawain, isang hakbang na maaaring panimula na mabago kung paano ang mga gumagamit at negosyo ay nakikipag-ugnayan sa Internet. Sa crucially para sa mga nag-develop, isinasama ng Google ang mga pag-andar ng Project Mariner sa Gemini API at Vertex AI, na may mas malawak na pagkakaroon na inaasahan ngayong tag-init.
Ang mga kasosyo sa pagsubok tulad ng Automation Kahit saan at ang Uipath ay nagtatayo ng mga solusyon sa mga kakayahang ito. Pagkatapos ay dahilan upang bigyang kahulugan ang mga layunin, gumawa ng isang plano, at kumilos. Ito ay nagsasangkot ng pagkilala at pag-unawa sa magkakaibang mga elemento ng web tulad ng teksto, code, mga imahe, at mga form upang makabuo ng isang komprehensibong pag-unawa sa nilalaman ng on-screen. Ang isang”magturo at ulitin”na karagdagang nagbibigay-daan sa AI na malaman ang mga gawain pagkatapos ng isang solong demonstrasyon. Pinapayagan nito ang ahente ng AI na makumpleto ang mga gawain sa background habang ang mga gumagamit ay nagpapatuloy sa iba pang gawain-isang kilalang pagpapabuti mula sa hinalinhan nito na direktang tumakbo sa browser ng gumagamit at limitadong kasabay na aktibidad. Sinabi ng Google na ang bagong pag-ulit ay maaaring hawakan ng hanggang sampung mga gawain nang sabay-sabay, isang malaking pagpapalakas sa kahusayan. Nakikipagtulungan ang Google sa mga kasosyo tulad ng Ticketmaster, StubHub, Resy, at Vagaro upang mapadali ang ilan sa mga pakikipag-ugnay na ito na hinihimok ng ahente. Inilarawan ng Google ang mode ng ahente bilang isang sistema kung saan ang mga gumagamit ay maaaring sabihin lamang ang kanilang layunin, at ang Gemini ay pagkatapos ay”intelektently mag-orkestra ng mga hakbang upang makamit ito.”
. Ang mga gawain tulad ng pangangaso sa apartment, kabilang ang mga booking tour gamit ang mga tool tulad ng Zillow. Pinalawak ng OpenAI ang pag-access sa ahente ng AI, operator, para sa mga gumagamit ng CHATGPT Pro noong Pebrero 2025, na nagpapahintulot sa automation ng mga digital na daloy ng trabaho, kahit na ang operator ay nangangailangan ng tahasang pag-apruba ng gumagamit bago magsagawa ng mga aksyon. Na-preview din ng Microsoft ang isang tampok na”paggamit ng computer”sa loob ng copilot studio nito noong Abril 2025, na naglalayong sa enterprise automation. Ang mga tool na ito, kasama ang Amazon’s Nova Act, ay higit sa lahat sa mga eksperimentong yugto, at ang mga unang karanasan ay minsan ay natagpuan ang mga ito na mabagal o madaling kapitan ng mga pagkakamali. Ang pagsasama ng Project Mariner sa mode ng ahente ng Gemini ay gumagamit ng mga advanced na modelo ng wikang pangitain upang bigyang kahulugan ang mga visual na elemento, isang pangunahing pagkakaiba-iba. Ang isang pag-aaral sa Carnegie Mellon University ay nag-aalok ng isang napakalaking pagtatasa ng mga kakayahan ng ahente ng AI. Itinuro ng mga mananaliksik ang mga isyu tulad ng”kakulangan ng pangkaraniwang kahulugan, hindi magandang kasanayan sa lipunan, at kawalan ng kakayahan sa pag-browse sa web,”pagtatapos na habang ang mga ahente ng AI ay maaaring makatulong, sila ay”malamang na hindi kapalit ng lahat ng mga gawain sa ngayon,”ayon sa pag-aaral. Ang mga ulat mula noong unang bahagi ng Mayo 2025 ay iminungkahi na ang Google ay sumusubok sa isang”computer use”function sa loob ng AI studio nito, na potensyal na maiugnay sa mga modelo ng Gemma 3 at naka-streamline na pag-deploy ng Cloud Run. Ito ay nakahanay sa mas malawak na diskarte ng Google Cloud, na tinukoy sa mga multi-agent AI system bilang”susunod na hangganan.”Habang patuloy na binuo ng Google ang mga teknolohiyang ahente na ito, ang kanilang tagumpay ay hindi lamang sa teknikal na katapangan kundi pati na rin sa pagtugon sa pagiging maaasahan, kaligtasan, at mga nuanced na mga hamon ng real-world task automation.