Google fördert seine KI-Agentenfunktionen erheblich und kündigt während seiner Google I/O 2025-Konferenz eine breitere Rollout-und wichtige Aktualisierungen an Project Mariner an. Diese experimentelle KI, die im Namen eines Benutzers auf Websites stöbert und mit ihnen interagiert, arbeitet jetzt auf Cloud-basierten virtuellen Maschinen und kann bis zu zehn Aufgaben gleichzeitig verwalten. Diese Entwicklung signalisiert den intensiven Push von Google, die Webinteraktion neu zu formen und KI zu befähigen, aktiv Aufgaben auszuführen. Ein Schritt, der grundlegend verändern könnte, wie Benutzer und Unternehmen mit dem Internet in Kontakt treten. Entscheidend für Entwickler integriert Google die Funktionen von Project Mariner in die Gemini-API und die Vertex-KI, wobei in diesem Sommer eine breitere Verfügbarkeit erwartet wird.
Diese Integration bietet Tools zum Erstellen von autonomem digitalen Erlebnis, vom Kauf von Tickets bis hin zur Bestellung von Lebensmitteln ohne direkte Website-Besuche. Testpartner wie Automatisierung überall und uipath erstellen bereits Lösungen mit diesen Funktionen. Browser, dann Grund, Ziele zu interpretieren, einen Plan zu erstellen und Maßnahmen zu ergreifen. Dies beinhaltet das Identifizieren und Verständnis verschiedener Webelemente wie Text, Code, Bildern und Formularen, um ein umfassendes Verständnis von Inhalten auf dem Bildschirm zu erstellen. Mit einem „Lehr-und Wiederholungs“-System kann die KI nach einer einzigen Demonstration Aufgaben erlernen. Auf diese Weise kann der AI-Agent Aufgaben im Hintergrund erledigen, während die Benutzer mit anderen Arbeiten fortfahren-eine bemerkenswerte Verbesserung des Vorgängers, der direkt auf dem Browser des Benutzers und einer begrenzten gleichzeitigen Aktivität lief. Google gibt an, dass die neue Iteration bis zu zehn Aufgaben gleichzeitig erledigen kann, ein erheblicher Effizienzschub. Google arbeitet mit Partnern wie Ticketmaster, StubHub, Resy und Vagaro zusammen, um einige dieser agentengesteuerten Interaktionen zu erleichtern. Google beschreibt den Agentenmodus als ein System, in dem Benutzer einfach ihr Ziel angeben können, und Gemini wird dann „die Schritte zur Erreichung des Unternehmens intelligent organisieren“. (Der Ansatz von Google zu solchen Technologien wird in ihrem
.