Anthrópio aparece pronto para levar conversas de voz ao seu aplicativo móvel assistente de AI Claude, com o recurso

A implementação inicial adota uma abordagem controlada para a conversa. Diferentemente dos sistemas que se esforçam para o modo de voz completamente fluido, do tipo humano, o modo de voz de Claude opera com base em push-to-Talk, assim como o ChatGPT antes do lançamento do modo de voz avançado. Este método impede que a IA interrompa os usuários, mas sacrifica a capacidade de interjeções espontâneas ou esclarecimentos no meio da pensamento. Relatórios iniciais sugerem que o sistema lida com a entrada de voz de maneira confiável, mesmo com pausas naturais, mas exige que o usuário mantenha seu dispositivo durante a interação.

Vem com visualizações de texto de push-to-talk e rolagem. Será uma grande atualização para o aplicativo móvel Claude! href=”https://twitter.com/testingcatalog/status/1919003910510961078?ref_src=twsrc%5etfw”Target=”_ Blank”> May 4, 2025 O modo Claude integra várias funcionalidades. Ele oferecerá quatro opções de voz -dois categorizados como masculino, dois como fêmeas-permitir alguns usuários de uso. Citadas fontes ao lado da resposta falada na interface do aplicativo. Esta interface exibe o histórico de conversas como texto paginado e rolável. Target=”_ Blank”> suporta uploads de arquivo , permitindo que os usuários forneçam imagens ou documentos em PDF e depois discutam seu conteúdo diretamente com a IA através dos comandos de voz, um recurso que o Google também está se desenvolvendo para o Gemini Live. O recurso segue a recente disponibilidade global de pesquisa na web dentro do aplicativo Claude Mobile em março. https://t.co/npqfvuw6pj pic.twitter.com/dojyp52bxk

-m1 (@m1astra)

Meta, enquanto isso, testes detalhados em abril de um experimental href=”https:>”Full-Duplex”Modo Para seu llapating 4-PowerEd Metaned ai Appi Api, App, limitado”. Os sistemas complexos complexos tentam permitir que ambas as partes (humanas e IA) falem simultaneamente, assim como um telefonema natural. A abordagem do

antropia também difere na entrada multimodal em comparação com alguns rivais. Embora os usuários do Claude possam fazer upload de arquivos estáticos como PDFs e imagens para discussão, os recursos ganhos Gemini Live do Google em março, permitindo a análise em tempo real de feeds de câmera de smartphone ao vivo e conteúdo na tela. O OpenAI já havia adicionado suporte ao vídeo ao vivo ao modo de voz do ChatGPT em dezembro de 2024.

Acesso e ética na voz AI

Como os usuários acessarão o modo de voz de Claude permanece não especificado, mas o mercado mostra estratégias variadas. O OpenAI começou a oferecer aos usuários de camadas livres limitadas visualizações diárias de seu modo de voz avançado (usando o modelo GPT-4O menos capaz) em fevereiro, reservando o acesso irrestrito por meio do modelo GPT-4O completo para assinantes pagantes. Essa estratégia em camadas contrasta fortemente com a Microsoft, que, no mesmo mês, tornou totalmente gratuitos sua voz copilota. Os modelos de fala a fala visam traduzir a entrada falada diretamente para a produção falada, reduzindo potencialmente a latência e capturando mais nuances vocais em comparação com os pipelines tradicionais de fala para texto. href=”https://cloud.google.com/text-to-pedeech/docs/chirp3-innstant-custom-voice”Target=”_ Blank”>”Voz personalizada instantânea” O recurso que levanta questões éticas sobre o consentimento para a replicação de voz. xAI’s Grok 3 voice mode, launched February 2025 for X Premium+ subscribers, notoriously includes an “Unhinged”option permitting swearing, insults, and explicit chat, reflecting a philosophy of minimal restriction quite different from the typically moderated outputs of mainstream assistants.

The pursuit of extreme realism, as seen with Sesame AI, also brings potential risks like sophisticated voice Clonagem para golpes, provocando discussões sobre se as vozes da IA ​​devem manter marcadores artificiais. O próprio Openi encontrou turbulência ética quando teve que retirar uma opção de voz em maio de 2024 devido à sua semelhança percebida com a atriz Scarlett Johansson.

Categories: IT Info