O Google está avançando significativamente seus recursos do agente de IA, anunciando uma implantação mais ampla e atualizações importantes para o Projeto Mariner durante sua conferência do Google E/O 2025. Esta IA experimental, projetada para navegar e interagir com sites em nome de um usuário, agora opera em máquinas virtuais baseadas em nuvem e pode gerenciar até dez tarefas simultaneamente. Esse desenvolvimento sinaliza o push intensificado do Google para remodelar a interação na Web, capacitando a IA a executar ativamente tarefas, um movimento que poderia alterar fundamentalmente como usuários e empresas se envolvem com a Internet. Crucialmente para os desenvolvedores, o Google está integrando as funcionalidades do Project Mariner na API Gemini e na AI Vertex, com uma disponibilidade mais ampla esperada neste verão.
Essa integração fornecerá ferramentas para criar experiências digitais mais autônomas, desde a compra de ingressos até o pedido de compras sem visitas diretas ao site. Parceiros de teste, como a automação em qualquer lugar e o UIPATH, já estão construindo soluções com esses recursos. Navegador, então razão para interpretar objetivos, fazer um plano e agir. Isso envolve identificar e entender diversos elementos da Web, como texto, código, imagens e formulários, para criar um entendimento abrangente do conteúdo na tela. Um sistema “ensinar e repetir” permite ainda que a IA aprenda as tarefas após uma única demonstração. Isso permite que o agente de IA conclua tarefas em segundo plano, enquanto os usuários continuam com outro trabalho-uma melhoria notável de seu antecessor, que foi executado diretamente no navegador do usuário e atividade simultânea limitada. O Google afirma que a nova iteração pode lidar com até dez tarefas de uma só vez, um impulso substancial na eficiência. O Google está colaborando com parceiros como Ticketmaster, StubHub, Resy e Vagaro para facilitar algumas dessas interações orientadas por agentes. O Google descreve o modo de agente como um sistema em que os usuários podem simplesmente declarar seu objetivo, e Gêmeos “orquestrarão de forma inteligente as etapas para alcançá-lo.”
A empresa explica ainda que o modo de agente integra recursos avançados, como navegação na Web ao vivo, pesquisa e integrações de aplicativos para gerenciar tarefas complexas com a supervisão mínima do usuário. (A abordagem do Google para tais tecnologias é descrita em seus