O Antrópico está lançando um modo de voz para sua IA Claude, permitindo conversas faladas em seus aplicativos móveis iOS e Android. Esse recurso beta, alimentado pelo novo modelo Claude Sonnet 4, está sendo lançado em inglês nas próximas semanas. Esta é uma etapa importante para o antrópico, posicionando-o diretamente contra os assistentes de voz de IA estabelecidos do OpenAI, Google e Meta. Os principais recursos incluem exibição na tela de pontos importantes durante a conversa e a capacidade de discutir documentos e imagens. vinculados aos seus planos de assinatura pagos.
Usuários gratuitos enfrentarão limites de uso; Centro de Ajuda do Anthropic Indicates A maioria pode existir em cerca de 20-30 conversas de voz. A empresa também enfatizou que a segurança era uma prioridade máxima durante o desenvolvimento, e sua documentação de suporte oferece dicas de solução de problemas para os usuários. Os usuários podem selecionar entre cinco opções de voz distintas, que podem ser alteradas posteriormente nas configurações. A documentação do Anthropic explica que as transcrições de bate-papo e as notas de voz resumidas são salvas no histórico de bate-papo do usuário, semelhante às interações baseadas em texto. pic.twitter.com/xvo5vhiceb
-Anthrópico (@AntropicAi) 27 de maio, 2025 aprimorando a acessibilidade. Para um desempenho ideal, o Antrópico aconselha usando o modo de voz em um ambiente tranquilo e falando claramente. Estão disponíveis controles específicos como pausa/currículo, mudo/atividade e conversas finais, de acordo com o Centro de Ajuda Antrópica. A OpenAI vem expandindo progressivamente seu modo de voz avançado ChatGPT, que em março foi estendido à Web com um fluxo de conversação aprimorado. A Microsoft adotou uma postura mais agressiva, tornando suas interações de voz copilot, incluindo recursos avançados de raciocínio, completamente gratuitos. A Meta lançou recentemente um aplicativo de meta AI independente, alimentado por seus novos modelos LLAMA 4 e apresentando interação de voz, incluindo um modo experimental”Full-Duplex”para um fluxo de conversação mais natural. Notavelmente, isso envolve um investimento e parceria de US $ 4 bilhões com o próprio Antrópico para integrar a IA Claude, destacando a crescente influência do antropal. No entanto, seu foco em recursos para a empresa pode dar-lhes uma vantagem com segmentos profissionais de usuários. Empresas especializadas como o gergelim Ai já estão desenvolvendo vozes hiper-realistas que imitam imperfeições humanas como hesitações.
Esta unidade para o realismo é equilibrada por desafios em andamento. Por exemplo, o Openai reconheceu que sua IA ainda pode experimentar alucinações ao interpretar a entrada de vídeo ao vivo, um recurso adicionado ao modo de voz avançado do ChatGPT em dezembro de 2024.