L’intelligence artificielle passe de l’assistance textuelle aux agents d’IA axés sur l’action capables d’exécuter des tâches numériques. OpenAI a élargi la disponibilité de l’opérateur, un outil d’automatisation alimenté en AI au sein de ChatGpt Pro, permettant aux utilisateurs de terminer des tâches en ligne structurées telles que le remplissage des formulaires, la récupération d’informations et la gestion des flux de travail en ligne.
Le déploiement amène l’opérateur aux abonnés de Chatgpt Pro en Australie, au Brésil, au Canada, en Inde, au Japon, à Singapour, en Corée du Sud, au Royaume-Uni et plus de pays.
L’opérateur est Maintenant, lancez-vous aux utilisateurs professionnels en Australie, au Brésil, au Canada, en Inde, au Japon, à Singapour, en Corée du Sud, au Royaume-Uni et la plupart des endroits où Chatgpt est disponible.
travaillant toujours sur la mise à disposition de l’opérateur dans l’EU, Switzerland, Norway, liechtenstein et Iceland-nous vous tenir au courant!
-Openai (@Openai) 21 février 2025 lui-même en concurrence directe avec des entreprises qui investissent dans l’automatisation des tâches alimentées par l’IA. Google se prépare à lancer un produit similaire avec Project Mariner , un agent AI construit avec Gemini 2.0 qui”peut comprendre et raison À travers tout sur l’écran de votre navigateur, y compris les pixels et les éléments Web comme le texte, le code, les images et les formulaires”pour une automatisation plus complexe.
Le Sonnet Claude 3.5 d’Anthropic a déjà étendu ses capacités AI dans le contrôle complet du bureau, permettant l’automatisation des flux de travail du système d’exploitation entier à travers Windows et MacOS.
Opérateur AI: comment il fonctionne et où il se trouve
Contrairement aux chatbots d’IA conventionnels qui s’appuient sur les invites utilisateur pour chaque action, l’opérateur permet une tâche numérique semi-autonome Exécution. 576″src=”https://winbuzzer.com/wp-content/uploads/2025/01/openai-operator-ai-agent-workflow-1-1024×576.jpg”>
L’opérateur nécessite une approbation explicite de l’utilisateur avant d’exécuter une action et un mode de prise de contrôle manuel permet une intervention si nécessaire. En restreignant l’opérateur à l’automatisation sur le Web, OpenAI adopte une approche prudente par rapport au Sonnet Claude 3.5 d’Anthropic, qui permet l’automatisation complète du bureau, y compris les interactions d’interface utilisateur, la saisie du clavier et la navigation système.
[Contenu intégré]
Le paysage compétitif de l’agent AI
L’exécution de la tâche alimentée par AI devient rapidement un champ de bataille pour la technologie Compagnies. Google, Openai et Anthropic sont en concurrence avec différentes approches de l’automatisation dirigée par l’IA. Microsoft entre également dans cette arène et vient de dévoiler son modèle de modèle d’IA fondamental qui permet également aux agents de l’IA de gérer les logiciels et même les systèmes robotiques via une entrée multimodale.
Project Mariner et opérateur de Google utilisent également l’IA multimodale, qui leur permet de traiter le texte, les images et le code en parallèle, ce qui les rend plus efficaces pour les workflows complexes, tout en se concentrant sur les tâches Web.
La transition de Les chatbots aux agents de l’IA capables d’exécuter des tâches se développent depuis des années. OpenAI, google et anthropic ont progressivement avancé leurs modèles, affiner les capacités d’automatisation et améliorer la prise de décision dirigée par l’IA.
En décembre 2023, OpenAI a testé en interne les prototypes d’agent IA en interne. En janvier 2024, l’introduction de la fonction de mémoire de Chatgpt a permis aux modèles d’IA de conserver les interactions passées, en définissant les bases de l’automatisation contextuelle. Quelques mois plus tard, Google, Microsoft et Meta ont introduit publiquement leurs propres stratégies d’automatisation axées sur l’IA.
La fonctionnalité d’utilisation de l’ordinateur de Sonnet d’Anthropic est devenue le premier outil d’IA capable de contrôler des environnements Windows et MacOS entiers, Paving, Paving La voie à l’automatisation complète du bureau.
L’opérateur d’Openai est le dernier signe que l’automatisation dirigée par AI va au-delà des phases expérimentales et dans la pratique applications. Au fur et à mesure que les agents de l’IA évoluent, l’industrie devra déterminer la quantité d’autonomie L’IA devrait avoir, si l’automatisation devrait rester strictement supervisée par les utilisateurs, ou si l’exécution des tâches dirigée par l’IA se développera progressivement à des modèles de prise de décision plus indépendants.