Amazon a făcut un pas strategic înainte prin introducerea SDK-ului Nova Act și lansarea nova.amazon.com, oferind acces public la modelele sale de fundație Nova. This signals a shift in the company’s AI strategy—from operating as a cloud infrastructure partner to directly equipping developers with tools to build AI agents capable of acting within web browsers.

Nova Act SDK for Web-Based AI Agents

Nova Act is a software development kit (SDK) designed to help developers create agents that can perform human-like tasks within a Mediul browserului. Acești agenți pot face clic pe butoane, să completeze formulare, pagini de defilare și să interacționeze cu elemente de site complexe-toate prin înțelegerea vizuală și interacțiunea dinamică. În loc să ofere doar un agent finalizat, Amazon oferă dezvoltatorilor o bază flexibilă pentru a-și construi propriile instrumente.

Google, în comparație, a dezvoltat cadrul lanțului de agenți, conceput pentru a coordona mai mulți agenți AI prin memorie partajată și comunicare modulară. Actul Nova al Amazonului pare să ia un traseu mai deschis, oferind un control mai profund, dar solicită mai multă implementare practică de la dezvoltatori.

Într-o demo partajată de Amazon, Nova Act își demonstrează capacitățile de agent de browser prin interacțiunea direct cu Google Maps. Agentul se motivează printr-o sarcină-căutând „Redwood City Caltrain Station”-și taie vizual întrebarea în bara de căutare, simulând o acțiune asemănătoare omului.

Sursa: Amazon

În partea stângă a ecranului, un fragment de cod definește o clasă Bikeroute, ceea ce sugerează că agentul va folosi timpul și distanța de ciclism ca constrângeri pentru a filtra listele de apartamente. This scenario illustrates how Nova Act can interpret user goals and autonomously navigate web interfaces to complete multi-step tasks like planning a commute-centric housing search.

Nova Foundation Models Now Available for Public Use

Amazon has also removed previous barriers to its Nova foundation models by opening up nova.amazon.com, which allows anyone to test and interact with Nova Micro, Lite, și pro. Anterior limitate la AWS Bedrock, aceste modele acceptă acum solicitări și experimentări orientate publicului, fără a necesita acreditări de acces în cloud sau întreprinderi.

[Conținut încorporat]

Nova acceptă 200+ limbi și gestionează contexte de până la 300.000 de jetoane, cu planuri de a ajunge la 2 milioane de jetoane în acest an. Medii reglementate, cum ar fi guvernul, finanțele și asistența medicală. De asemenea, dezvoltatorii pot accesa instrumente de generare vizuală, cum ar fi Nova Canvas și Nova Reel, care creează imagini și videoclipuri și includ verificări de siguranță încorporate și cadre de atribuire.

Aceste instrumente permit dezvoltatorilor să urmărească modul în care este generat conținutul vizual, abordând preocupările în creștere în jurul dezinformării și provenienței media sintetice. Înainte, Amazon se pregătește să lanseze un model de raționament marca Nova, așteptat până la jumătatea anului 2025. Se pare că acest model va combina capacitățile de conversație rapidă cu un raționament mai profund, întreruperea divizării dintre interacțiunile în timp real și analiza de formare lungă.

Amazon se poziționează clar pentru a concura cu sisteme de raționament mai mature, cum ar fi Claude 3.7 Sonet, Openai O3-minini, precum și Google Gemini 2,5 Propertal. Noul Asistent Voice Alexa+, care oferă automatizare bazată pe AI și coordonare a serviciilor fără probleme.

Concurența globală evidențiază strategiile de agent divergente

În timp ce Amazon se concentrează pe unelte, alte companii fac curse pentru a livra agenți care se confruntă cu utilizatorii finali. Zhipu AI din China tocmai a lansat AutoGLM, un agent gratuit alimentat de modelul său ușor GLM-Z1-AIR.

proiectat pentru medii constrânse, Autoglm rulează în browser sau prin intermediul aplicațiilor mobile și a fost comparativ-de compania-brevet GPT-4O și CLAUDE 3.5 Sonnet în testele agentului Stanford. Zhipu intenționează, de asemenea, să opereze agentul în aprilie, subliniind accesibilitatea pentru dezvoltatori și instituții globale din afara sferei AI de Vest.

La începutul lunii, Manus AI a făcut titluri pentru lansarea unui sistem complet autonom, capabil să ia măsuri fără aprobarea utilizatorului. Construit de Butterfly Effect (Hong Kong), agentul folosește consolidarea învățării, înlănțuirea LLM și un strat de control cu ​​mai multe semnături pentru a executa fluxuri de lucru și a angaja contractori.

în urma invitațiilor beta limitate, care au fost revândute pentru mii de dolari, compania a introdus niveluri oficiale plătite oficiale la 39 de dolari și 199 $/lună. Grows

Spre deosebire de companiile axate pe agenții Frontend, strategia Amazon este de a construi fiecare strat al stivei AI-de la siliciu personalizat la modele de bază la instrumente orientate spre dezvoltatori. Stack-ul Nova al companiei este instruit pe grupuri masive alimentate de chipsurile sale de la Trainium 2 și susținute de miliarde de investiții în infrastructură. În A Interviu recent cu Time , CEO-ul AWS, Matt Garman implementarea, dar crește și bara pentru adoptarea dezvoltatorilor. Spre deosebire de agenții plug-and-play, cum ar fi operatorul sau AutoGLM, Nova Act necesită mai mult efort din partea utilizatorilor pentru a personaliza, implementa și menține agenții la scară.

că compromisul poate limita tracțiunea între utilizatorii generali, dar apelează la organizațiile care doresc să încorporeze în profunzime AI în cadrul fluxurilor de lucru interne sau a platformelor proprii și a modelului de model în care se poate trece la schimbarea transparenței novA SDK și a modelului public. și controlul utilizatorului. Prin prima abordare a dezvoltatorului, compania nu permite doar adoptarea AI-ci abilitarea unei generații de constructori să decidă ce vor face acei agenți și cum o vor face.

Categories: IT Info