A Microsoft está transformando o Windows 11 em um “PC de IA” com uma grande atualização do Copilot anunciada hoje, com o objetivo de tornar a interação com os computadores mais natural e inteligente.

Uma nova palavra de ativação “Ei, Copilot” permite que os usuários dêem comandos de voz, enquanto o Copilot Vision, agora disponível globalmente, permite que a IA veja e entenda o que está na tela para fornecer ajuda.

A Microsoft também está apresentando uma prévia do Copilot experimental Ações, que capacitam o assistente a realizar tarefas diretamente no PC para o usuário. Essas atualizações, lançadas agora, representam a visão da Microsoft de incorporar profundamente um parceiro proativo de IA no núcleo de seu sistema operacional. Yusuf Mehdi enquadrou claramente a ambição, afirmando: “a visão que temos é: vamos reescrever todo o sistema operacional em torno da IA e construir essencialmente o que se torna verdadeiramente o PC com IA”.

A revisão sinaliza uma aposta estratégica de que o futuro da computação pessoal não se trata apenas de poder de processamento, mas de interação inteligente e conversacional. O objetivo é tornar cada dispositivo Windows 11 uma plataforma para esse novo paradigma, que também inclui conectores Copilot para serviços como o Gmail.

‘Ei, Copilot’: a voz se torna uma entrada central do PC

A Microsoft está fazendo um esforço renovado e ambicioso para estabelecer a voz como o principal método de interação com o PC. A peça central desse esforço é a nova palavra de ativação “Ei, Copiloto”, agora com disponibilidade geral, que elimina o atrito de clicar em um ícone para iniciar uma conversa. Esse recurso é fundamental para a estratégia da empresa de tornar sua poderosa IA mais acessível a um público mais amplo.

Esta não é a primeira tentativa da empresa de integração de voz. Os críticos são rápidos em apontar o fracasso espetacular da Cortana no Windows 10 há uma década. No entanto, a Microsoft está apostando que a sofisticação da IA ​​moderna finalmente convencerá os usuários de que falar com seus PCs não é estranho, provocando uma mudança genuína no comportamento onde os esforços anteriores não conseguiram.

A confiança da empresa é apoiada por dados internos que sugerem que quando as pessoas usam voz, elas interagem com o Copilot duas vezes mais do que quando usam texto.

A Microsoft aponta para comportamentos existentes, como os bilhões de minutos gastos conversando em Reuniões de equipe e uso de ferramentas de acessibilidade, como prova de que os usuários já se sentem confortáveis ao falar em seus dispositivos.

A experiência foi projetada para ser perfeita. Depois de ativar o recurso opt-in nas configurações, dizer “Ei, Copiloto” faz com que um ícone de microfone e um sinal sonoro apareçam, confirmando que o assistente está ouvindo. Os usuários podem encerrar a conversa dizendo “Tchau” ou simplesmente interrompendo a interação. Essa facilidade de uso é o que a Microsoft acredita ser o “desbloqueio mágico” para voz.

[conteúdo incorporado]

Yusuf Mehdi, chefe de consumo da Microsoft, acredita que essa mudança será profunda. “Em nossas mentes, a voz agora se tornará o terceiro mecanismo de entrada a ser usado com o seu PC”, explicou ele em um briefing.

Essa ambição vai além do simples ditado, posicionando a voz como uma ferramenta para comandos e consultas complexas que podem preencher a lacuna entre a intenção do usuário e a habilidade de solicitação da IA.

A visão definitiva é a de um computador verdadeiramente conversacional e responsivo. “Você deve ser capaz de conversar com seu PC, fazer com que ele o entenda e, então, fazer mágica acontecer a partir disso.”

Mehdi acrescentou. Isso representa uma aposta significativa, apostar que a IA finalmente tornou a interação por voz atraente o suficiente para mudar décadas de hábitos de usuário construídos em torno do teclado e do mouse.

Uma IA que vê sua tela: o Copilot Vision é lançado globalmente

Um componente-chave desse futuro centrado em IA é o Copilot Vision, que agora está disponível em todos os mercados onde o Copilot é oferecido. O recurso permite que a IA “veja” e analise a tela de um usuário, fornecendo ajuda contextual em qualquer aplicativo.

Esse recurso evoluiu rapidamente desde sua primeira visualização limitada, que estava confinada ao navegador Edge e exigia uma assinatura paga.

O recurso transforma o Copilot de um chatbot passivo em um guia visual ativo. Ao contrário do controverso recurso Recall, o Vision é estritamente opcional e nem sempre está ativado.

Os usuários devem conceder permissão explicitamente para cada sessão clicando em um “ícone de óculos” distinto, essencialmente transmitindo a visualização da tela de maneira semelhante a uma chamada do Teams.

Depois de ativado, o Vision pode oferecer instruções passo a passo, solucionar problemas do PC ou responder a perguntas sobre o conteúdo da tela. A capacidade expandiu-se da visualização de aplicativos únicos para um modo completo de “Compartilhamento de área de trabalho”, que permite que a IA entenda o contexto em todo o fluxo de trabalho do usuário.

[conteúdo incorporado]

A equipe do Microsoft Copilot explicou a funcionalidade, afirmando: “quando você compartilha sua área de trabalho (ou qualquer navegador específico ou janela de aplicativo), o Copilot pode ver o que você vê e conversar com você sobre isso em tempo real”.

Prático as aplicações são extensas. Um usuário pode pedir dicas sobre um projeto criativo, obter ajuda para melhorar seu currículo ou receber orientação enquanto navega em um novo jogo. Um recurso de “Destaques” permite até que o Copilot aponte visualmente onde clicar para concluir uma tarefa. Para maior produtividade, ele pode analisar uma apresentação inteira do PowerPoint em busca de insights sem que o usuário precise folhear cada slide.

Embora o Vision possa ver e aconselhar, ele não pode agir em nome do usuário; esse recurso é reservado para o recurso Copilot Actions separado. Para tornar a experiência mais versátil, a Microsoft também está preparando um modo “Text-in Text-out”, permitindo que os usuários interajam com o Vision por meio de texto em vez de apenas voz.

Esse reconhecimento de todo o sistema é crucial para fornecer assistência verdadeiramente contextual. Ao entender o que um usuário está fazendo, o Copilot pode oferecer suporte relevante sem exigir longas explicações, aproximando-se do objetivo de ser um “companheiro do dia a dia”. Uma barra de tarefas reimaginada fornece acesso com um clique a essas ferramentas, integrando-as ainda mais à experiência principal do Windows.

Do assistente ao agente: O Copilot Actions assume o controle do seu PC

Talvez o elemento mais inovador da atualização seja a visualização experimental do Copilot Actions para arquivos locais. Disponível para Windows Insiders por meio do Copilot Labs, esse recurso permite que a IA realize tarefas de várias etapas diretamente no PC do usuário. Isto marca um passo significativo em direção a um futuro de IA de agência, onde o assistente não apenas responde, mas trabalha ativamente em seu nome.

Esse novo recurso transforma o Copilot no que a Microsoft chama de “agente de uso geral”. Em vez de apenas responder a perguntas, ele pode abrir aplicativos, digitar, rolar e executar cadeias complexas de ações.

Os usuários podem descrever uma tarefa com suas próprias palavras, como classificar fotos de férias ou extrair informações de um PDF, e o agente tentará concluí-la interagindo com aplicativos de desktop e web.

O sistema foi projetado para funcionar como um verdadeiro colaborador digital. Enquanto o agente trabalha em segundo plano, os usuários ficam livres para se concentrar em outras coisas. A qualquer momento, eles podem monitorar o progresso do agente, revisar as ações específicas que ele executou ou até mesmo retomar totalmente o controle da tarefa. Esse recurso se expande nas ações baseadas na Web que a Microsoft anunciou pela primeira vez em abril, trazendo o poder da automação diretamente para a área de trabalho do Windows.

No entanto, a empresa está sendo transparente sobre sua natureza experimental e está começando com um conjunto restrito de casos de uso para otimizar o desempenho e aprender com o uso no mundo real.

Navjot Virk, vice-presidente corporativo de experiências do Windows da Microsoft, alertou que o sistema ainda está aprendendo. “No início, você pode ver o agente cometer alguns erros ou encontrar alguns desafios ao tentar usar alguns aplicativos realmente complexos”, observou ela.

Essa transparência faz parte de uma estratégia deliberada para gerenciar as expectativas dos usuários em relação a essa tecnologia poderosa, mas nascente.

[conteúdo incorporado]

Aprendendo com o recall: um novo foco em adesão e segurança

A Microsoft está claramente enfatizando o design opcional e centrado na privacidade desses novos recursos. Essa abordagem cautelosa é uma resposta direta e necessária à forte reação contra o recurso Windows Recall, que foi fortemente criticado por suas vulnerabilidades de segurança significativas após seu lançamento.

O Recall foi inicialmente vendido com a promessa de privacidade no dispositivo. Na época, Yusuf Mehdi afirmou:”O Recall aproveita seu índice semântico pessoal, construído e armazenado inteiramente em seu dispositivo. Seus instantâneos são seus; eles permanecem localmente em seu PC.”

Essa promessa foi quebrada quando os pesquisadores descobriram que o recurso armazenava seus dados em um banco de dados local não criptografado, criando o que muitos chamaram de “mina de ouro para malware”.

As intensas críticas forçaram o empresa a adiar o recurso e reprojetar sua segurança. Com o Copilot Vision and Actions, a Microsoft não corre riscos.

A empresa publicou um conjunto claro de compromissos de segurança, enfatizando que essas poderosas experiências de agente estão sendo introduzidas de forma responsável.

Crucialmente, o Copilot Actions está desativado por padrão. Os usuários devem optar explicitamente por ativá-lo e podem pausá-lo, assumir o controle ou desativá-lo a qualquer momento.

A Microsoft também promete visibilidade total, permitindo que os usuários monitorem o progresso do agente e revisem cada passo que ele dá. Para decisões confidenciais, o agente pode até solicitar aprovação específica antes de prosseguir.

Esse afastamento da captura passiva de dados da Recall é fundamental para construir a confiança do usuário. O novo modelo para Copilot Actions foi projetado para garantir que o usuário esteja sempre no controle, um forte contraste com a abordagem inicial sempre ativa da Recall. Este lançamento cuidadoso, com prévia prévia, foi projetado para coletar feedback e refinar os controles de segurança antes de um lançamento mais amplo.

Em última análise, a Microsoft está posicionando seu AI PC como um parceiro confiável. Como afirmou Mehdi, “queremos que todas as pessoas que fazem a mudança experimentem o que significa ter um PC que não é apenas uma ferramenta, mas um verdadeiro parceiro”.

O sucesso desta visão ambiciosa dependerá não apenas da capacidade da tecnologia, mas da capacidade da empresa de convencer os usuários de que suas novas e poderosas ferramentas de IA são seguras e protegidas.

[conteúdo incorporado]

Categories: IT Info