Amazon har tagit ett strategiskt steg framåt genom att introducera NOVA Act SDK och lansera Nova.amazon.com, vilket ger allmänhetens tillgång till sina NOVA-stiftelsemodeller. This signals a shift in the company’s AI strategy—from operating as a cloud infrastructure partner to directly equipping developers with tools to build AI agents capable of acting within web browsers.
Nova Act SDK for Web-Based AI Agents
Nova Act is a software development kit (SDK) designed to help developers create agents that can perform human-like tasks inom en webbläsarmiljö. Dessa agenter kan klicka på knappar, fylla i formulär, bläddra och interagera med komplexa platselement-allt genom visuell förståelse och dynamisk interaktion. I stället för att bara erbjuda en färdig agent ger Amazon utvecklare en flexibel bas för att bygga sina egna verktyg.
Google, i jämförelse, har utvecklat ramkedjan för agenter, utformat för att samordna flera AI-agenter genom delat minne och modulär kommunikation. Amazons NOVA-akt verkar ta en mer öppen väg och erbjuda djupare kontroll men kräver mer praktisk implementering från utvecklare.
>
I en demo som delas av Amazon, visar Nova Act sina webbläsaragentfunktioner genom att interagera direkt med Google Maps. Agenten resonerar genom en uppgift-söka efter”Redwood City Caltrain Station”-och visuellt skriver frågan in i sökfältet och simulerar en mänsklig liknande handling.
Källa: Amazon
På vänster sida av skärmen definierar ett kodavsnitt en Bikeroute-klass, vilket tyder på att agenten kommer att använda cykeltid och avstånd som begränsningar för att filtrera lägenhetslistor. Detta scenario illustrerar hur NOVA ACT kan tolka användarmål och autonomt navigera på webbgränssnitt för att slutföra flerstegsuppgifter som att planera en pendlingscentrerad bostadssökning.
Nova Foundation-modeller som nu är tillgängliga för allmän användning
Amazon har också tagit bort tidigare barrier till sina novu-modeller genom att öppna Nova. Lite och Pro. Previously confined to AWS Bedrock, these models now support public-facing prompts and experimentation—without requiring cloud access or enterprise credentials.
[embedded content]
Nova supports 200+ languages and handles contexts up to 300,000 tokens, with plans to reach 2 million tokens later this year.
Earlier this month, Amazon extended its Nova models to AWS GovCloud for use in Reglerade miljöer som regering, finans och sjukvård. Utvecklare kan också komma åt visuella generationverktyg som Nova Canvas och Nova Reel, som skapar bilder och videor och inkluderar inbyggda säkerhetskontroller och tillskrivningsramar.
Dessa verktyg gör det möjligt för utvecklare att spåra hur visuellt innehåll genereras, adresserar växande problem kring felinformation och syntetiska medieprov. Amazon förbereder sig för att släppa en Nova-märkes resonemodell som förväntas i mitten av 2025. This model will reportedly combine fast conversational capabilities with deeper reasoning, bridging the divide between real-time interactions and long-form analysis.
Amazon is clearly positioning itself to compete with more mature reasoning systems like Claude 3.7 Sonnet, OpenAI’s o3-mini, and the just released Google Gemini 2.5 Pro experimental model.
Meanwhile, Nova Act is expected to play a core role in Dess nya Alexa+ Voice Assistant, som erbjuder AI-driven automatisering och sömlös servicekoordination.
Global Competition Highlights Diverging Agent Strategies
Medan Amazon fokuserar på verktyg, tävlar andra företag för att leverera sluttävande agenter. Kinas Zhipu AI lanserade just AutoGlm, ett fritt agent som drivs av sin lätta GLM-Z1-Air-modell.
designad för begränsade miljöer, AutoGLM Runs In-webbläsare eller via mobilappar och har benchmarkats-av företaget-Above GPT-4O och Claude 3.5 Sonnet i Stanford’s Agent. Zhipu planerar också att öppna agenten i april och betonade tillgängligheten för utvecklare och globala institutioner utanför Western AI-sfären.
Tidigare i månaden gjorde Manus AI rubriker för att lansera ett helt autonomt system som kan vidta åtgärder utan användargodkännande. Byggd av fjärilseffekt (Hong Kong) använder agenten förstärkningslärande, LLM-kedjan och ett multisignaturkontrolllager för att utföra arbetsflöden och anställa entreprenörer.
Följande Beta-inbjudningar som säljs för tusentals dollar, företaget introducerade officiella betalda nivåer som är prissatta till $ 39 och $ 199/månad. Växer
Till skillnad från företag som är inriktade på frontendagenter är Amazons strategi att bygga varje lager av AI-stacken-från anpassade kisel till grundläggande modeller till utvecklarvänliga verktyg. Företagets Nova Stack är utbildad i massiva kluster som drivs av sina Trainium 2-chips och stöds av miljarder i infrastrukturinvesteringar. I en Nyligen intervju med tid , AWS CEO Matt Garman betonade att Amazons mål är att erbjuda AI-tjänster med långvarig kostnadseffektivitet och skala. distribution men höjer också baren för utveckling av utvecklaren. Till skillnad från plug-and-play-agenter som operatör eller AutoGLM, kräver Nova Act mer ansträngning från användare för att anpassa, distribuera och underhålla agenter i skala.
att avvägning kan begränsa dragkraften bland allmänna användare men vädjar till organisationer som vill inbäddar AI djupt inom interna arbetsflöden eller proprietära plattformar. kontroll. Med sin utvecklare-första strategi aktiverar företaget inte bara AI-adoption-det stärker en generation byggare att bestämma vad dessa agenter kommer att göra och hur de gör det.