Amazon a fait un pas en avant stratégique en présentant le SDK de la loi Nova et en lançant Nova.amazon.com, offrant un accès public à ses modèles de la NOVA Foundation. Cela signale un changement dans la stratégie d’IA de l’entreprise-du fonctionnement en tant que partenaire d’infrastructure cloud pour équiper directement les développeurs d’outils pour créer des agents d’IA capables d’agir au sein des navigateurs Web.
NOVA ACT SDK pour les agents d’AI basés un environnement de navigateur. Ces agents peuvent cliquer sur les boutons, remplir les formulaires, faire défiler les pages et interagir avec des éléments du site complexes, tout par la compréhension visuelle et l’interaction dynamique. Plutôt que d’offrir simplement un agent fini, Amazon offre aux développeurs une base flexible pour construire leurs propres outils.
Google, en comparaison, a développé le cadre de la chaîne d’agents, conçu pour coordonner plusieurs agents d’IA par la mémoire partagée et la communication modulaire. Le NOVA Act d’Amazon semble prendre un itinéraire plus ouvert, offrant un contrôle plus profond mais exigeant une implémentation plus pratique des développeurs.
Dans une démo partagée par Amazon, Nova Act démontre ses capacités de navigateur-agent en interagissant directement avec Google Maps. L’agent raisonne à travers une tâche-rechercher la «Station de Caltrain de Redwood City»-et tape visuellement la requête dans la barre de recherche, simulant une action humaine.
Source: Amazon
sur le côté gauche de l’écran, un extrait de code définit une classe Bikeroute, suggérant que l’agent utilisera le temps et la distance du vélo comme contraintes pour filtrer les listes d’appartements. Ce scénario illustre comment Nova Act peut interpréter les objectifs des utilisateurs et naviguer de manière autonome sur les interfaces Web pour effectuer des tâches en plusieurs étapes, comme la planification d’une recherche de la fondation centrée sur les nœuds.
NOVA Foundation Models Disponible pour un usage public
Amazon a également supprimé des barrières précédentes à ses modèles Nova Foundation en ouvrant Nova.amazon.com, qui permet à n’importe qui pour tester NOVA Foundation, en ouvrant NOVA.amazon.com Lite et Pro. Auparavant confiné dans le substratumaire AWS, ces modèles prennent désormais en charge les invites et l’expérimentation destinées au public-sans l’accès au cloud ou les informations d’identification. environnements réglementés tels que le gouvernement, la finance et les soins de santé. Les développeurs peuvent également accéder aux outils de génération visuelle comme Nova Canvas et Nova Reel, qui créent des images et des vidéos et inclure des vérifications de sécurité et des cadres d’attribution intégrés.
Ces outils permettent aux développeurs de tracer la façon dont le contenu visuel est généré, répondant aux préoccupations croissantes concernant la désinformation et l’intégration des médias synthétiques.
Modèle de recours et Alexa + L’intégration est la prochaine
Amazon se prépare à publier un modèle de raisonnement de marque Nova attendu d’ici la mi-2025. Ce modèle combinerait des capacités conversationnelles rapides avec un raisonnement plus approfondi, rédigera le fossé entre les interactions en temps réel et l’analyse longue.
Amazon se positionne clairement pour concurrencer les systèmes de raisonnement plus matures comme le sonnet Claude 3.7, le modèle expérimental d’Openai. New Alexa + Voice Assistant, qui propose une automatisation alimentée par AI et une coordination de service sans couture.
La compétition mondiale met en évidence les stratégies d’agent divergentes
Alors qu’Amazon se concentre sur l’outillage, d’autres sociétés courent pour livrer des agents finaux orientés vers les utilisateurs. Le Zhipu AI chinois vient de lancer Autoglm, un agent libre propulsé par son modèle GLM-Z1-Air léger.
Conçu pour des environnements contraints, Autoglm exécute In-Browser ou via des applications mobiles et a été benchmarked-par la société-Above GPT-4O et Claude 3.5 SENNET aux tests d’agent de Stanford. Zhipu prévoit également d’ouvrir l’agent en avril, mettant l’accent sur l’accessibilité pour les développeurs et les institutions mondiales en dehors de la sphère de l’IA occidentale.
Plus tôt dans le mois, Manus IA a fait les gros titres pour le lancement d’un système entièrement autonome capable de prendre des mesures sans approbation de l’utilisateur. Construit par Butterfly Effect (Hong Kong), l’agent utilise l’apprentissage par renforcement, le chaînage LLM et une couche de contrôle multi-signature pour exécuter des flux de travail et embaucher des entrepreneurs.
Après des invitations bêta limitées qui ont été reouillées pour des milliers de dollars, la société a introduit des tiers officiels à 39 $/mois.
Grows
Contrairement aux entreprises axées sur les agents du frontend, la stratégie d’Amazon est de construire chaque couche de la pile d’IA-du silicium personnalisé aux modèles fondamentaux aux outils orientés vers les développeurs. La pile Nova de la société est formée sur des grappes massives alimentées par ses puces Trainium 2 et soutenue par des milliards d’investissement dans les infrastructures. Dans un une interview récente avec Time , le PDG de l’AWS Matt Garman a souligné que l’objectif d’Amazon est d’offrir des services AI à long terme à la maquette à long terme. déploiement mais soulève également la barre d’adoption des développeurs. Contrairement aux agents de plug-and-play comme l’opérateur ou l’autoglm, la loi Nova nécessite plus d’efforts des utilisateurs pour personnaliser, déployer et maintenir les agents à grande échelle.
que le compromis peut limiter la traction parmi les utilisateurs généraux, mais attirer les organisations qui cherchent à intégrer profondément AI dans les flux de travail internes ou les plateformes de modèle de propriété. Contrôle de l’utilisateur. Avec son approche pour les développeurs, l’entreprise ne permet pas seulement d’adopter l’adoption de l’IA-cela donne une génération de constructeurs pour décider de ce que ces agents feront et comment ils le feront.