O Openai lançou hoje o ChatGPT Agent, seu assistente de IA mais poderoso até o momento, com o objetivo de criar uma ferramenta que conclua ativamente o trabalho para os usuários, em vez de apenas responder a perguntas. O novo agente opera um”computador virtual”para executar tarefas complexas e de várias etapas. Este lançamento aumenta a corrida pela supremacia na IA Agentic, colocando o OpenAI contra iniciativas do Google, Antrópico e Microsoft. Ele substitui a ferramenta operadora da empresa, que foi introduzida pela primeira vez em janeiro de 2025 como um agente mais limitado baseado no navegador. Bidding
agente chatgpt Representa a tentativa mais ousada do OpenAI ainda de criar um produto verdadeiramente agêntico. É alimentado por um novo modelo não nomeado da família OpenAi O3 . O sistema foi projetado para descarregar tarefas complexas de usuários, como planejar eventos, verificando um calendário ou gerando um slide deck. Essa reestruturação interna ressalta a importância estratégica de ir além do simples chatbots. Ele combina um navegador visual remoto com um terminal para executar o código, executar a análise de dados e até criar planilhas. Fontes e aplicativos como o Google Drive, um avanço significativo de ofertas anteriores.
O modelo subjacente possui desempenho de ponta em benchmarks difíceis. No FrontierMath, um teste de matemática desafiador, o agente obteve 27,4% ao usar suas ferramentas, um salto maciço dos 6,3% alcançados pelo modelo superior anterior, O4-mini. O líder de pesquisa Isa Fulford observou que os usuários não devem assistir a isso funcionar, enquadrando-o como assistente de fundo.”Mesmo que demore 15 minutos, meia hora, é uma grande aceleração em comparação com quanto tempo você levaria para fazê-lo”, disse ela, enfatizando seu papel no lidar com processos demorados. href=”https://cdn.openai.com/pdf/18a02b5d-6b67-4cec-ab64-68cdfbddebcd/preparedfness-framework-v2.pdf”target=”_”> safuguards de sua preparação
O controle do usuário é um tema central. Fulford confirmou que”antes do agente do ChatGPT fazer qualquer coisa”irreversível”, como enviar um e-mail ou fazer uma reserva, ele pede permissão primeiro”. Essa etapa de confirmação do usuário é fundamental para ações com consequências do mundo real, com base no design de segurança do agente do operador anterior. Outras camadas de segurança incluem um”modo de relógio”. Esse recurso paussa automaticamente a execução do agente em sites sensíveis, como portais financeiros, se o usuário navegar para longe da guia. Além disso, o OpenAI desativou o recurso de memória do ChatGPT no lançamento para mitigar os riscos de exfiltração de dados de ataques rápidos de injeção. É uma resposta direta a ferramentas semelhantes de rivais. O Anthropic foi cedo com seu recurso”Uso do computador”para os modelos Claude, lançado em outubro de 2024. O Google também é fortemente investido, com seu projeto Mariner e testes de uma função de”uso de computador”em seu estúdio de IA. A Microsoft também está incorporando recursos do tipo agente em seu estúdio Copilot. Charles Lamanna, um vice-presidente da Microsoft, capturou sucintamente o objetivo: “Se uma pessoa pode usar o aplicativo, o agente também pode.” Mesmo antes deste lançamento, o operador do OpenAI mostrou uma vantagem competitiva, superando rivais em referências como webVoyager e Osworld, que testem os Browser e o sistema de sistema. Essa história define uma barra alta para o novo agente mais capaz. Esse impulso competitivo vem apesar das perguntas sobre a eficácia do agente. Um estudo recente de Carnegie Mellon descobriu que mesmo os principais modelos de IA lutam com tarefas de automação de negócios, destacando problemas com o senso comum e a navegação na web. O novo agente do OpenAI será medido contra esses benchmarks de desempenho do mundo real.