Amazon zrobił strategiczny krok naprzód, wprowadzając SDK ACT Nova Act i uruchamiając nova.amazon.com, zapewniając publiczny dostęp do modeli Foundation Nova. Sygnalizuje to zmianę strategii AI firmy-od działalności jako partner infrastruktury w chmurze, aby bezpośrednio wyposażyć programistów w narzędzia do budowania agentów AI zdolnych do działania w przeglądarkach internetowych.

nova Act SDK dla programów internetowych AI

nova akt jest zaprojektowany, aby pomóc w tworzeniu Agentów, które mogą wykonywać ludzkie agenci AI

nova akt. Środowisko przeglądarki. Agenci te mogą kliknąć przyciski, wypełniać formularze, przewijać strony i wchodzić w interakcje ze złożonymi elementami witryny-wszystko poprzez zrozumienie wizualne i dynamiczną interakcję. Zamiast tylko oferować gotowego agenta, Amazon daje programistom elastyczną bazę do budowania własnych narzędzi.

Google, dla porównania, opracował ramę łańcucha agentów, zaprojektowaną do koordynowania wielu agentów AI poprzez współdzieloną pamięć i komunikację modułową. Akt Nova Amazon wydaje się wybierać bardziej otwartą trasę, oferując głębszą kontrolę, ale wymagając bardziej praktycznej implementacji od deweloperów.

W demo udostępnionym przez Amazon Act Nova Act pokazuje swoje możliwości agenta przeglądarki poprzez bezpośrednio interakcję z Mapami Google. Agent uzasadnia zadanie-poszukując „stacji Redwood City Caltrain”-i wizualnie wpisuje zapytanie do paska wyszukiwania, symulując działanie podobne do człowieka.

Źródło: Amazon

Po lewej stronie ekranu fragment kodu definiuje klasę motocyklową, sugerując, że agent użyje czasu i odległości rowerowej jako ograniczeń do filtrowania ofert mieszkań. Ten scenariusz ilustruje, w jaki sposób NOVA ACT może interpretować cele użytkowników i autonomicznie nawigować interfejsy internetowe w celu wykonania wieloetapowych zadań, takich jak planowanie wyszukiwania mieszkaniowego zorientowane na dojazdy.

Modele fundamentów nova dostępne teraz do użytku publicznego

Amazon, również usunęło poprzednie bariery modeli Foundation, otwierając nova. Lite i pro. Wcześniej ograniczone do skale AWS, te modele obsługują teraz publiczne podpowiedzi i eksperymenty-bez wymagania dostępu do chmury lub poświadczeń przedsiębiorstw.

[Wbudowana treść]

Nova obsługuje ponad 200 języków i obsługuje konteksty do 300 000 tokenów, z planami osiągnięcia 2 milionów tokenów w tym roku. Regulowane środowiska, takie jak rząd, finanse i opieka zdrowotna. Deweloperzy mogą również uzyskać dostęp do narzędzi generowania wizualnego, takich jak Nova Canvas i Nova Reel, które tworzą obrazy i filmy oraz zawierają wbudowane kontrole bezpieczeństwa i ramy atrybucji.

Te narzędzia umożliwiają programistom wygenerowanie treści wizualnych, odnosząc się do rosnących obaw dotyczących dezinformacji i syntetycznego układu mediów.

Model rozumowania i Alexa+ jest następny

Globalne konkurencje podkreśla rozbieżne strategie agentów

Podczas gdy Amazon koncentruje się na oprzyrządowaniu, inne firmy ścigają się, aby dostarczyć agentów końcowych. Chińska AI ZHIPU właśnie uruchomiła Autoglm, wolny agent zasilany lekkim modelem GLM-Z1-Air.

Zaprojektowany dla ograniczonych środowisk, AutoGLM działa w przeglądarce lub za pośrednictwem aplikacji mobilnych i został zrównany-przez firmę-Above GPT-4O i Claude Sonnet w Stanford w AgentBench’s Tests. Zhipu planuje również otwarcie agenta w kwietniu, podkreślając dostępność programistów i globalnych instytucji poza Zachodnią AI Sfera.

Na początku miesiąca Manus AI znalazł się na pierwszych stronach gazet w pełni autonomicznym systemie zdolnym do podjęcia działań bez zatwierdzenia użytkownika. Zbudowany przez Effect Butterfly (Hongkong), agent wykorzystuje uczenie się wzmocnienia, łączenie LLM i warstwę kontrolną wielu podpisów w celu wykonywania przepływów pracy i zatrudniania wykonawców.

Po ograniczonych zaproszeniach beta, które zostały odsprzedane dla tysiącach dolarów, firma wprowadziła oficjalne płatne teoriny w cenie 39 USD i miesiąc. Grows

W przeciwieństwie do firm koncentrujących się na agentach frontendowych, strategia Amazon polega na budowaniu każdej warstwy stosu AI-od niestandardowych krzemu po podstawowe modele po narzędzia skierowane do programistów. Stack firmy Nova jest przeszkolony w masowych klastrach napędzanych przez swoje wióry Ten Trainium 2 i wspierane przez miliardy inwestycji w infrastrukturę. W Ostatnie wywiad z czasem , dyrektor generalny AWS Matt Garmon podkreślił, że celem Amazon jest oferowanie usług AI z długoterminową wydajnością i skalą. wdrożenie, ale także podnosi adwokat do adopcji deweloperów. W przeciwieństwie do agentów plug-and-play, takich jak operator lub autoglm, Nova Act wymaga więcej wysiłku od użytkowników w celu dostosowywania, wdrażania i utrzymywania agentów na dużą skalę.

, że kompromis może ograniczać trakcję ogólnej użytkowników, ale odwołuje się do organizacji, którzy chcą osadzić AI głęboko w wewnętrznych przepływach pracy lub platformach właścicieli. Przejrzystość i kontrola użytkownika. Dzięki podejściu do programistów firma nie umożliwia tylko adopcji AI-umożliwia pokolenie budowniczych do decydowania, co zrobią ci agenci i jak to zrobią.

Categories: IT Info