künstliche Intelligenz verlagert sich von textbasierten Unterstützung über actionorientierte AI-Agenten, die digitale Aufgaben ausführen können. OpenAI hat die Verfügbarkeit von Operator erweitert, ein KI-angetriebenes Automatisierungs-Tool innerhalb von Chatgpt Pro, mit dem Benutzer strukturierte Online-Aufgaben wie das Ausfüllen von Formularen, das Abrufen von Informationen und die Bearbeitung webbasierter Workflows erledigen können.
Der Rollout bringt Betreiber zu Chatgpt Pro-Abonnenten in Australien, Brasilien, Kanada, Indien, Japan, Singapur, Südkorea, Großbritannien und mehr Ländern. selbst im direkten Wettbewerb mit Unternehmen, die in KI-angetriebene Aufgabenautomatisierung investieren. Google bereitet sich darauf vor, ein ähnliches Produkt mit Project Mariner zu starten , einem mit Gemini 2.0 erstellten KI Überall auf Ihrem Browserbildschirm, einschließlich Pixel und Webelementen wie Text, Code, Bildern und Formularen”für komplexere Automatisierung.
Anthropic’s Claude 3.5 Sonnet already extended its AI capabilities into full desktop control, enabling automation of entire operating system workflows über Fenster und macos. Autonome digitale Aufgabenausführung. Unabhängigkeit.-1024×576.jpg”>
Der Bediener erfordert vor der Ausführung einer Aktion und eines manuellen Übernahmemodus eine explizite Benutzergenehmigung Ermöglicht bei Bedarf Intervention. Durch die Einschränkung des Bedieners auf webbasierte Automatisierung verfolgt OpenAI einen vorsichtigen Ansatz im Vergleich zu Claude 3.5-Sonnet von Anthropic, das die vollständige Desktop-Automatisierung ermöglicht, einschließlich UI-Interaktionen, Tastatureingang und Systemnavigation.
[eingebettete Inhalt]
Die wettbewerbsfähige KI-Agent-Landschaft
AI-betriebene Aufgabenausführung wird schnell zu einem Schlachtfeld für Technologieunternehmen. Google, OpenAI und Anthrop konkurrieren mit unterschiedlichen Ansätzen für die KI-gesteuerte Automatisierung. Microsoft tritt auch in diese Arena ein und hat gerade sein grundlegendes KI-Modellmagma vorgestellt, mit dem AI-Agenten die Verwaltung von Software und sogar Robotersystemen über multimodale Eingaben verwalten können. Verarbeiten Sie Text, Bilder und Code parallel, wodurch sie für komplexe Workflows effektiver werden und sich auf webbasierte Aufgaben konzentrieren.
Der Übergang Von Chatbots bis hin zu KI-Agenten, die Aufgaben ausführen können, entwickelt sich seit Jahren. OpenAI, Google und Anthropic haben ihre Modelle nach und nach weiterentwickelt, die Automatisierungsfunktionen verfeinert und die Entscheidungsfindung der KI-gesteuerten Entscheidungen verbessert. Bis Januar 2024 ermöglichte die Einführung der Memory-Funktion von ChatGPT AI-Modelle, vergangene Interaktionen beizubehalten und die Grundlage für die kontextbezogene Automatisierung festzulegen. Einige Monate später führten Google, Microsoft und Meta öffentlich ihre eigenen KI-gesteuerten Automatisierungsstrategien ein. Der Weg für die vollständige Desktop-Automatisierung. in praktische Anwendungen. Wenn sich die AI-Agenten weiterentwickeln, muss die Branche bestimmen, wie viel Autonomie-KI sein sollte, ob die Automatisierung streng von Benutzer überprüft bleiben sollte oder ob sich die Ausführung von AI-gesteuerten Aufgaben allmählich in unabhängigere Entscheidungsmodelle ausdehnt.