Amazon ha dado un paso estratégico al presentar el SDK de la Ley Nova y el lanzamiento de nova.amazon.com, proporcionando acceso público a sus modelos de la Fundación Nova. Esto señala un cambio en la estrategia de IA de la compañía, desde el funcionamiento como un socio de infraestructura en la nube hasta equipar directamente a los desarrolladores con herramientas para construir agentes de IA capaces de actuar dentro de los navegadores web.
Nova Act SDK para agentes de IA basados en la web
Nova ACT es una Ley de desarrollo de software (SDK) diseñada a ayuda de Ayudes de Ayudes de Ayuda Diseñados de Ayudos de Ayuda. Un entorno de navegador. Estos agentes pueden hacer clic en botones, completar formularios, desplazarse e interactuar con elementos complejos del sitio, todo a través de la comprensión visual y la interacción dinámica. En lugar de solo ofrecer un agente terminado, Amazon está brindando a los desarrolladores una base flexible para construir sus propias herramientas.
Google, en comparación, ha desarrollado el marco de la cadena de agentes, diseñado para coordinar múltiples agentes de IA a través de la memoria compartida y la comunicación modular. La Ley de Nova de Amazon parece tomar una ruta más abierta, ofreciendo un control más profundo pero exigiendo más implementación práctica de los desarrolladores.
En una demostración compartida por Amazon, la ACT Nova demuestra sus capacidades de agente de navegador al interactuar directamente con Google Maps. El agente razona a través de una tarea, examinando la”estación de Redwood City Caltrain”, y escribe visualmente la consulta en la barra de búsqueda, simulando una acción humana.
Fuente: Amazon
En el lado izquierdo de la pantalla, un fragmento de código define una clase de Bikeroute, lo que sugiere que el agente usará el tiempo y la distancia en bicicleta como restricciones para filtrar los listados de apartamentos. Este escenario ilustra cómo la ACT de Nova puede interpretar los objetivos del usuario y navegar de forma autónoma las interfaces web para completar tareas de múltiples pasos, como planificar una búsqueda de viviendas centrada en el viaje. y pro. Anteriormente confinados a AWS Bedrock, estos modelos ahora admiten indicaciones y experimentación con orientación pública y experimentación, sin requerir acceso a la nube o credenciales empresariales.
[Contenido integrado]
Nova admite más de 200 idiomas y maneja contextos hasta 300,000 tokens, con planes para alcanzar 2 millones de tokens más tarde este año.
temprano este mes, Amazon extendió sus tokens a Aws a Aws para usar a AWS para usar a Aws Models a Aws Model entornos regulados como el gobierno, las finanzas y la atención médica. Los desarrolladores también pueden acceder a herramientas de generación visual como Nova Canvas y Nova Reel, que crean imágenes y videos e incluyen verificaciones de seguridad incorporadas y marcos de atribución.
Estas herramientas permiten a los desarrolladores rastrear cómo se genera el contenido visual, abordando las crecientes preocupaciones sobre la información errónea y la procedencia sintética.
Modelo de razonamiento y Alexa+ Integración es Next
Amazon se está posicionando claramente para competir con los sistemas de razonamiento más maduros como Claude 3.7 Sonnet, el O3-Mini de OpenAi y el modelo de Google Gemini 2.5 Properimental de nuevo. Alexa+ Voice Assistant, que ofrece automatización con IA y coordinación de servicios sin problemas.
La competencia global destaca las estrategias de agentes divergentes
Mientras que Amazon se enfoca en las herramientas, otras compañías están corriendo para entregar agentes de usuarios finales. El Zhipu AI de China acaba de lanzar AutoGlm, un agente libre alimentado por su ligero modelo GLM-Z1-Air.
Diseñado para entornos restringidos, Autoglm ejecuta en el navegador o a través de aplicaciones móviles y se ha comparado, por la compañía, la compañía GPT-4O y Claude 3.5 sonnet en las pruebas de agente de Stanford. Zhipu también planea código abierto al agente en abril, enfatizando la accesibilidad para desarrolladores e instituciones globales fuera de la esfera de IA occidental.
A principios de mes, Manus AI fue noticia para lanzar un sistema totalmente autónomo capaz de tomar acciones sin la aprobación del usuario. Construido por Butterfly Effect (Hong Kong), el agente emplea el aprendizaje de refuerzo, el encadenamiento de LLM y una capa de control de múltiples firmas para ejecutar flujos de trabajo y contratar contratistas.
siguiendo las invitaciones beta limitadas que fueron resentadas por miles de dólares, la compañía introdujo niveles oficiales pagados a niveles a $ 39 y $ 199/mes. Cultiva
A diferencia de las empresas centradas en los agentes frontend, la estrategia de Amazon es construir cada capa de la pila de IA, desde silicio personalizado hasta modelos fundamentales hasta herramientas orientadas al desarrollador. La pila Nova de la compañía está capacitada en grupos masivos impulsados por sus chips de Entrenium 2 y respaldado por miles de millones en inversión de infraestructura. En a Entrevista reciente con tiempo , el CEO de AWS, Matt Garman, enfatizó que el objetivo de Amazon es ofrecer servicios de AI con un rentable a largo plazo y escala. despliegue pero también plantea el listón para la adopción del desarrollador. A diferencia de los agentes de plug-and-play como el operador o la autoglm, la Ley Nova requiere más esfuerzo de los usuarios para personalizar, implementar y mantener a los agentes a escala.
que la compensación puede limitar la tracción entre los usuarios generales, pero apelar a las organizaciones que buscan ai profundamente dentro de los flujos de trabajo internos o las plataformas de propietarios. control de usuario. Con su enfoque de desarrollador primero, la compañía no solo permite la adopción de la IA, sino que está capacitando a una generación de constructores decidir qué harán esos agentes y cómo lo harán.