Google znacznie rozwija swoje funkcje agenta AI, ogłaszając szersze wdrożenie i kluczowe aktualizacje Project Mariner podczas konferencji Google I/O 2025. Ta eksperymentalna sztuczna inteligencja, zaprojektowana do przeglądania i interakcji ze stronami internetowymi w imieniu użytkownika, działa obecnie na wirtualnych maszynach w chmurze i może jednocześnie zarządzać maksymalnie dziesięć zadań. Ten rozwój sygnalizuje zintensyfikowane naciski Google do przekształcenia interakcji internetowych, umożliwiając sztuczną inteligencję do aktywnego wykonywania zadań, co może zasadniczo zmienić sposób, w jaki użytkownicy i firmy angażują się w Internet. Początkowo
Początkowo projekt Project Mariner jest dostępny dla subskrybentów amerykańskich subskrybentów Google w wysokości 249,99 $ AI Ultra, z obsługą dla większej liczby krajów. Co najważniejsze dla programistów, Google integruje funkcje Project Mariner z API Gemini i Vertex AI, z szerszą dostępnością tego lata.
Ta integracja zapewni narzędzia do tworzenia bardziej autonomicznych doświadczeń cyfrowych, od zakupu biletów po zamawianie artykułów spożywczych bez bezpośrednich wizyt na stronie internetowej. Partnerzy testowi, tacy jak automatyzacja w dowolnym miejscu i UIPath, już budują rozwiązania z tymi możliwościami.
Podstawa maryna projektu, jak to Google DeepMind. Przeglądarka, a następnie powód interpretacji celów, tworzenia planu i podejmowania działań. Obejmuje to identyfikację i zrozumienie różnorodnych elementów internetowych, takich jak tekst, kod, obrazy i formularze, aby zbudować kompleksowe zrozumienie treści na ekranie. System „Naucz i powtarzaj” pozwala sztucznej inteligencji na uczenie się zadań po pojedynczej demonstracji.
Ulepszone możliwości i wrażenia użytkownika
Kluczową aktualizacją dla Project Mariner jest przejście do uruchamiania maszyn wirtualnych w chmurze. Umożliwia to agentowi AI wykonywanie zadań w tle, podczas gdy użytkownicy kontynuują inne prace-godna uwagi poprawa w stosunku do jego poprzednika, który działał bezpośrednio w przeglądarce użytkownika i ograniczoną aktywność równoczesną. Google twierdzi, że nowa iteracja może obsługiwać maksymalnie dziesięć zadań jednocześnie, znaczny wzrost wydajności.
[Treść wbudowana]
Użytkownicy ostatecznie będą mogli uzyskać dostęp do Project Mariner za pośrednictwem trybu AI w wyszukiwarce Google, początkowo za pośrednictwem laboratoriów wyszukiwania, z demonstracją pokazującą tryb AI szybkie wyszukiwanie i zastrzeżenie gier baseballowych. Google współpracuje z partnerami takimi jak Ticketmaster, Stubhub, Resy i Vagaro, aby ułatwić niektóre z tych interakcji opartych na agentach.
Oprócz tego Google pokazał również wczesną wersję „trybu agenta” w aplikacji Gemini. Google opisuje tryb agenta jako system, w którym użytkownicy mogą po prostu podać swój cel, a Bliźnięta „inteligentnie zorganizują kroki, aby to osiągnąć.”
Firma wyjaśnia ponadto, że tryb agenta integruje zaawansowane funkcje, takie jak przeglądanie stron internetowych, badania i integracje aplikacji w celu zarządzania złożonymi zadaniami z minimalnym nadzorem użytkownika. (Podejście Google do takich technologii jest opisane w ich
Project Mariner w Google wchodzi w coraz bardziej konkurencyjny dziedzinę automatyzacji AI. Openai poszerzył dostęp do agenta AI, operatora, dla użytkowników Chatgpt Pro w lutym 2025 r., Umożliwiając automatyzację cyfrowych przepływów pracy, chociaż operator wymaga wyraźnego zatwierdzenia użytkownika przed wykonaniem działań. W kwietniu 2025 r. Microsoft zapowiedział także funkcję „używania komputera” w swoim studio Copilot, skierowanym do Automation Enterprise. Anthropic był również kluczowym graczem, ulepszając model sonetowy Claude 3.5 w październiku 2024 r., Który pozwala mu zarządzać zadaniami komputerowymi. Te narzędzia, w tym Act Amazon Nova Act, są w dużej mierze w etapach eksperymentalnych, a wczesne doświadczenia czasami okazały się powolne lub podatne na błędy. Integracja Project Mariner z trybem agenta Gemini wykorzystuje zaawansowane modele w języku wizji w celu interpretacji elementów wizualnych, kluczowego wyróżnika. Pomimo szybkiego postępu, praktyczna skuteczność obecnych agentów AI w autonomicznym przechodzeniu złożonych dróg zawodowych. Badanie Uniwersytetu Carnegie Mellon oferowało otrzeźwiającą ocenę możliwości agenta AI. Badanie wykazało, że nawet prowadzenie AI w pełni wykonało tylko 24% przypisanych zadań. Naukowcy wskazali na takie kwestie, jak „brak zdrowego rozsądku, złe umiejętności społeczne i niekompetencja w przeglądaniu stron internetowych”, stwierdzając, że chociaż agenci AI mogą pomóc, „prawdopodobnie nie są zastępowaniami wszystkich zadań”, zgodnie z badaniem. Własne eksplorację Google do AI agentów AI wykraczają poza Project Mariner. Raporty z początku 2025 r. Sugerowały, że Google testuje funkcję „używania komputera” w swoim studio AI, potencjalnie powiązanym z modelami Gemma 3 i usprawnionym wdrożeniem w chmurze. Jest to zgodne z szerszą strategią Google Cloud, która określa multi-agentowe systemy AI jako „następną granicę”. “ Google CEO Sundar Pichai podkreślił tę wizję, opisując agentów jako systemów„ łączące inteligencję zaawansowanych modeli AI z dostępem do narzędzi, aby mogli podejmować działania w twoimołowym i pod twoją kontrolą “, w Google I/O. Ponieważ Google nadal opracowuje te technologie agencyjne, ich sukces będzie zależeć nie tylko na sprawności technicznej, ale także na rozwiązywanie niezawodności, bezpieczeństwa i dopracowanych wyzwań związanych z automatyzacją zadań. Prowadzenie konkurencyjnego krajobrazu agentów AI
Wydajność rzeczywistości i szersze strategia AI