Amazon hat einen strategischen Schritt nach vorne gemacht, indem er den Nova Act SDK vorgestellt und nova.amazon.com auf den Markt gebracht hat, wodurch öffentliche Zugriff auf seine Nova Foundation-Modelle gewährt werden. Dies signalisiert eine Verschiebung der KI-Strategie des Unternehmens-vom Betrieb als Cloud-Infrastrukturpartner bis hin zur direkten Ausstattung von Entwicklern mit Tools, um AI-Agenten zu erstellen, die in Webbrowsern handeln können. Innerhalb einer Browserumgebung. Diese Agenten können auf Schaltflächen klicken, Formulare ausfüllen, Seiten scrollen und mit komplexen Site-Elementen interagieren-alle durch visuelles Verständnis und dynamische Interaktion. Anstatt nur einen fertigen Agenten anzubieten, bietet Amazon Entwicklern eine flexible Basis, um ihre eigenen Tools zu erstellen. Das Nova Act von Amazon scheint eine offenere Route zu nehmen, die eine tiefere Kontrolle bietet, aber von Entwicklern eine praktische Implementierung fordert. src=”Daten: Bild/SVG+XML; Nitro-Treppy-ID=Mty3odoyotk=-1; Base64, Phn2zyb2AWV3QM94psiwidagntawidi4 MSIGD2LKDGG9IJUWMCIGAGVPZ2H0PSIYODIIHHTBG5ZPSJODHRWOI8VD3D3LNCZLM9YZY8YMDAWL3N2ZYI+PC9ZDMC+”>
In einer von Amazon geteilten Demo demonstriert NOVA Act seine Funktionen der Browser-Agent, indem er direkt mit Google Maps interagiert. Der Agent begrüßt durch eine Aufgabe-die Suche nach der”Redwood City Caltrain Station”-und sucht die Abfrage visuell in die Suchleiste und simuliert eine menschliche Aktion.
Quelle: Amazon
Auf der linken Seite des Bildschirms definiert ein Code-Snippet eine Bikeroute-Klasse, was darauf hindeutet, dass der Agent die Fahrzeit und Entfernung als Einschränkungen für die Filter-Apartment-Listen verwendet. Dieses Szenario zeigt, wie Nova ACT die Benutzerziele interpretieren und autonom navigieren kann, um mehrstufige Aufgaben wie die Planung einer pendelorientierten Wohnungssuche zu erledigen. Lite und Pro. Zuvor auf AWS-Grundgestein beschränkt, unterstützen diese Modelle nun öffentlich ausgerichtete Eingabeaufforderungen und Experimente-ohne Cloud-Zugriff oder Unternehmensanmeldeinformationen zu erfordern. Regulierte Umgebungen wie Regierung, Finanzen und Gesundheitswesen. Entwickler können auch Tools zur visuellen Generierung wie Nova Canvas und Nova Reel zugreifen, die Bilder und Videos erstellen und integrierte Sicherheitsüberprüfungen und Attributions-Frameworks enthalten. Im Voraus bereitet sich Amazon auf die Veröffentlichung eines von Mitte 2025 erwarteten Argumentationsmodells vor. Dieses Modell wird Berichten zufolge schnelle Konversationsfähigkeiten mit tieferem Denken kombinieren und die Kluft zwischen Echtzeit-Interaktionen und Langformanalysen überbrücken. New Alexa+ Voice Assistant, der KI-anbetriebene Automatisierung und nahtlose Servicekoordination anbietet. Chinas Zhipu AI hat gerade Autoglm auf den Markt gebracht, einen freien Agenten, der von seinem leichten GLM-Z1-Air-Modell betrieben wurde. Zhipu plant außerdem, den Agenten im April Open-Source-Agenten zu betonen und die Zugänglichkeit für Entwickler und globale Institutionen außerhalb der westlichen KI-Sphäre hervorzuheben.
Zu Beginn des Monats machte Manus AI Schlagzeilen, um ein vollständig autonomes System zu starten, das ohne Benutzergenehmigung in der Lage ist, ohne Benutzergenehmigung Maßnahmen zu ergreifen. Der von Butterfly Effect (Hongkong) erbaute Agent verwendet Verstärkungslernen, LLM-Ketten und eine Mehrsignaturkontrollschicht, um Workflows und Hire-Auftragnehmer auszuführen. Wächst
Im Gegensatz zu Unternehmen, die sich auf Frontend-Agenten konzentrieren, besteht die Strategie von Amazon darin, jede Schicht des KI-Stapels zu erstellen-von benutzerdefiniertem Silizium bis hin zu grundlegenden Modellen bis hin zu Entwickler-Tools. Der Nova Stack des Unternehmens ist auf massiven Cluster ausgebildet, die von den Training 2-Chips angetrieben und von Milliarden an Infrastrukturinvestitionen unterstützt werden. In a aktuelles Interview mit der Zeit AWS-CEO Matt Garman betonte, dass Amazon das Ziel von AMI-Diensten mit Langzeit-Kosten-Effizienz und skalierter modellantrieb und skalierter modelgrain und skalierter modmodell und skaliertes Angebot von Ama-Diensten, die Ama-Overficien-Effizienz und skaliert haben. Einsatz, aber auch die Messlatte für die Einführung von Entwicklern erhöht. Im Gegensatz zu Plug-and-Play-Agenten wie Operator oder Autoglm erfordert Nova ACT mehr Aufwand von Benutzern, um Agenten in Maßstab anzupassen, bereitzustellen und zu pflegen. Kontrolle. Mit seinem Entwickler-First-Ansatz ermöglicht das Unternehmen nicht nur die Akzeptanz von KIs, sondern eine Generation von Bauherren, zu entscheiden, was diese Agenten tun und wie sie es tun werden.