Amazon ha fatto un passo avanti strategico introducendo la NOVA Act SDK e lanciando Nova.Amazon.com, fornendo accesso al pubblico ai suoi modelli Nova Foundation. This signals a shift in the company’s AI strategy—from operating as a cloud infrastructure partner to directly equipping developers with tools to build AI agents capable of acting within web browsers.
Nova Act SDK for Web-Based AI Agents
Nova Act is a software development kit (SDK) designed to help developers create agents that can perform human-like tasks all’interno di un ambiente del browser. Questi agenti possono fare clic sui pulsanti, compilare i moduli, scorrere le pagine e interagire con elementi del sito complessi, il tutto attraverso la comprensione visiva e l’interazione dinamica. Invece di offrire un agente finito, Amazon sta offrendo agli sviluppatori una base flessibile per costruire i propri strumenti.
Google, in confronto, ha sviluppato il framework della catena degli agenti, progettato per coordinare più agenti di intelligenza artificiale attraverso la memoria condivisa e la comunicazione modulare. L’atto Nova di Amazon sembra prendere un percorso più aperto, offrendo un controllo più profondo ma chiedendo una maggiore implementazione pratica dagli sviluppatori.
>
In una demo condivisa da Amazon, Nova Act dimostra le sue capacità di agente browser interagendo direttamente con Google Maps. L’agente ragiona attraverso un compito, ricercando la”stazione di Caltrain di Redwood City”-e digita visivamente la query nella barra di ricerca, simulando un’azione simile all’uomo.
Fonte: Amazon
Sul lato sinistro dello schermo, uno snippet di codice definisce una classe bikeroute, suggerendo che l’agente utilizzerà il tempo e la distanza in bicicletta come vincoli per filtrare gli elenchi di appartamenti. Questo scenario illustra come Nova Act può interpretare gli obiettivi degli utenti e navigare autonomamente le interfacce Web per completare le attività a più fasi come la pianificazione di una ricerca abitativa incentrata sul pendolare.
Nova Foundation Modelli ora disponibili per il pubblico
Amazon ha rimosso anche i precedenti barriere ai suoi modelli di fondazione Nova aprindo Nova.Mazon, che consente a Test e per testare e, per quanto riguarda il test e il testern, che consentono a testare e per cui il testern e il testern e il testern e il testern e per il test per il test e per il testern. Lite e Pro. Precedentemente confinati a AWS Bedrock, questi modelli ora supportano istruzioni e sperimentazioni rivolte al pubblico, senza richiedere l’accesso al cloud o le credenziali aziendali.
[Contenuto incorporato]
Nova supporta 200+ lingue e gestisce i contesti di govcon a 300.000 token, con i piani per raggiungere 2 milioni di token per raggiungere 2 milioni ambienti regolamentati come governo, finanza e assistenza sanitaria. Gli sviluppatori possono anche accedere a strumenti di generazione visiva come Nova Canvas e Nova Reel, che creano immagini e video e includono controlli di sicurezza integrati e framework di attribuzione.
Questi strumenti consentono agli sviluppatori di tracciare il modo in cui i contenuti visivi sono generati, affrontando le crescenti preoccupazioni Guardando avanti, Amazon si sta preparando a rilasciare un modello di ragionamento a marchio Nova previsto entro la metà del 2025. Secondo quanto riferito, questo modello combinerà rapide capacità di conversazione con ragionamenti più profondi, colmando la divisione tra interazioni in tempo reale e analisi a forma lunga.
Amazon si sta chiaramente posizionando se stesso per competere con sistemi di ragionamento più maturi come Claude 3.7 Sonetto, non si aspetta che il suo ruolo di OpenAi A Core di nuovo è un nuovo ruolo da parte di Over Act di Openi e si aspetta un nuovo ruolo da parte di Over Act di Openi e si è previsto per il nuovo ruolo da parte di Over Act di Openi e il nuovo compito di Openi e il nuovo compito di Openi e il nuovo compito di fare un nuovo ruolo da parte di un compito di Openi e di Openi di Overi Alexa+ Voice Assistant, che offre automazione alimentare e coordinamento del servizio senza soluzione di continuità.
La concorrenza globale evidenzia le strategie di agenti divergenti
mentre Amazon si concentra sugli strumenti, altre aziende stanno correndo per offrire agenti di uscita. Zhipu AI della Cina ha appena lanciato Autoglm, un agente libero alimentato dal suo leggero modello GLM-Z1-Air.
Progettato per ambienti vincolati, Autoglm funziona in browser o tramite app mobili ed è stato confrontato con la compagnia-in base alla compagnia-a causa della società GPT-4o e Claude 3.5 Sonet in sonetto di Stanford di Stanford. Zhipu prevede inoltre di open-source dell’agente in aprile, sottolineando l’accessibilità per gli sviluppatori e le istituzioni globali al di fuori della sfera dell’IA occidentale.
All’inizio del mese, Manus Ai ha fatto notizia per il lancio di un sistema completamente autonomo in grado di intraprendere azioni senza approvazione degli utenti. Built by Butterfly Effect (Hong Kong), the agent employs reinforcement learning, LLM chaining, and a multi-signature control layer to execute workflows and hire contractors.
Following limited beta invites that were resold for thousands of dollars, the company introduced official paid tiers priced at $39 and $199/month.
Amazon’s Full-Stack Ambition Grows
A differenza delle aziende focalizzate sugli agenti del frontend, la strategia di Amazon è quella di costruire ogni livello dello stack AI, dal silicio personalizzato ai modelli fondamentali per gli strumenti per gli sviluppatori. Lo stack Nova dell’azienda è addestrato su enormi cluster alimentati dai suoi chip del Trainium 2 e sostenuto da miliardi di investimenti a infrastrutture. In a intervista recente con tempo , il CEO di AWS Matt Garman ha sottolineato che l’obiettivo di Amazon è quello di offrire servizi di AI con i costi a lungo termine. e dispiegamento, ma aumenta anche l’asticamento per l’adozione degli sviluppatori. A differenza degli agenti plug-and-play come l’operatore o AutoGLM, Nova Act richiede maggiori sforzi da parte degli utenti per personalizzare, distribuire e mantenere gli agenti su scala.
che il compromesso può limitare la trazione tra gli utenti generali, ma appello alle organizzazioni di AI incorporate a sfuggite di working in profondità. e controllo dell’utente. Con il suo approccio per lo sviluppatore, l’azienda non sta solo abilitando l’adozione dell’IA: sta dando il potere a una generazione di costruttori di decidere cosa faranno quegli agenti e come lo faranno.