A tendência de agentes de IA que vão além do bate-papo para fazer as coisas ativamente em um computador dá mais um passo adiante. A Microsoft nesta semana começou a visualizar uma função de”uso do computador”dentro de sua plataforma de baixo código Copilot Studio, projetada para permitir que as empresas criem assistentes de IA que possam navegar e operar sites e aplicativos de desktop tradicionais. Esses agentes funcionam simulando ações humanas-clicando em botões, digitando em campos, selecionando menus-apontando para automatizar tarefas mesmo em sistemas que não possuem interfaces modernas de programação para integração direta. Ao contrário do recurso de’ações’mais limitado na versão do consumidor da Copilot, este capacidade de estúdio Copilot tem como alvo os cenários mais amplos de automação corporativa. Ondas antrópicas fabricadas em outubro de 2024, introduzindo um recurso com o mesmo nome,”Uso do computador”, para o seu modelo Claude 3,5 sonetos, permitindo que ele gerencie tarefas de mesa. O Google também é conhecido por desenvolver recursos semelhantes sob o nome do Project Mariner. A entrada da Microsoft, alojada dentro de sua ferramenta Copilot Studio (que se integra à plataforma de energia), tem como alvo os navegadores da Web (suportando Edge, Chrome e Firefox de acordo com o blog oficial) e os ambientes de desktop, oferecendo potencialmente escopo de automação mais amplo do que o operador, executando diretamente na infraestrutura da Microsoft. src=”https://winbuzzer.com/wp-content/uploads/2025/04/microsoft-copilot-studio-computer-use–ool-fticial.jpg”>
Uma abordagem da AIF para a automação de automação
Controle da máquina. “Se uma pessoa pode usar o aplicativo, o agente também pode” De acordo com a Microsoft,”ele se ajusta em tempo real usando o raciocínio interno para corrigir problemas por conta própria, para que o trabalho continue sem interrupção”. Construir essas automações envolve descrever a tarefa desejada em linguagem natural, e os desenvolvedores recebem feedback em vídeo em tempo real, mostrando as etapas planejadas do agente para facilitar o refinamento. A empresa recentemente detalhou outros agentes especializados para o Microsoft 365 (‘pesquisador’e’analista’) e cibersegurança, e revelou seu modelo de fundação multimodal Magma AI em fevereiro de 2025, projetado para tarefas complexas de interação envolvendo visão e ação. O recurso de uso do computador se beneficia com esse plano de fundo, teoricamente, permitindo que ele entenda e interaja com as GUIs com mais inteligência. O blog oficial observa que “os fabricantes podem ver um histórico de atividade de uso do computador à vontade, incluindo capturas de tela capturadas e etapas de raciocínio”. No entanto, fornecendo a IA as chaves para operar interfaces de software inerentemente traz considerações de segurança em foco. Acalando o equilíbrio certo entre funcionalidade e segurança será fundamental. As partes interessadas precisam de um ambiente de visualização localizado nos EUA para se inscrever via Formulário de inscrição da Microsoft . A Microsoft indica que mais informações estarão próximas em seu Construir uma conferência de desenvolvedor em maio de 2025 .