A Microsoft anunciou hoje um novo recurso para seu navegador Edge na Build 2024 que traduzirá e dublará vídeos em tempo real. Esse recurso estará disponível em plataformas populares como YouTube, LinkedIn e Coursera. O anúncio foi feito durante o evento Build deste ano, destacando a integração da IA para melhorar a experiência do usuário.
Idiomas suportados e acessibilidade
Inicialmente, o recurso será suporta traduções de espanhol para inglês e de inglês para alemão, hindi, italiano, russo e espanhol. Este desenvolvimento não atende apenas aos usuários que preferem consumir conteúdo em seu idioma nativo, mas também visa tornar os vídeos mais acessíveis para pessoas surdas ou com deficiência auditiva. A tradução em tempo real estará disponível por meio de dublagem e legendas.
Expansão para sites de notícias
Além de plataformas educacionais e de mídia social, o Edge irá estender essa funcionalidade a sites de notícias, incluindo Reuters, CNBC e Bloomberg. A Microsoft indicou planos para expandir a gama de idiomas e sites suportados ao longo do tempo, tornando esse recurso mais versátil e amplamente aplicável.
[conteúdo incorporado]
Esse novo recurso de tradução se baseia no conjunto existente de recursos de IA do Microsoft Edge, que inclui integração com o Copilot. O Edge já oferece a capacidade de resumir vídeos do YouTube, embora dependa da disponibilidade de transcrições de vídeos para gerar esses resumos. Esse novo recurso representa uma melhoria significativa no kit de ferramentas de IA do navegador.
Contexto histórico de tradução de IA em produtos Microsoft
A Microsoft tem um histórico de incorporação de IA tradução em seus produtos. Desde 2018, o Microsoft Teams oferece tradução de mensagens inline e, em 2022, a tradução ao vivo de legendas foi introduzida para assinantes do Teams Premium. O navegador Edge oferece suporte à tradução de páginas da web e texto selecionado desde 2020. Além disso, a atualização do Windows 11 2022 trouxe legendas geradas por IA para vídeos transmitidos e pré-gravados, embora sem recursos de tradução.
Dublagem, que envolve a substituição do áudio falado por uma voz gerada por IA no idioma nativo do usuário, é uma nova adição ao conjunto de recursos da Microsoft. Este processo pode consumir muitos recursos. Por exemplo, serviços como synthesys.io oferecem geração limitada de áudio/vídeo por US$ 20 por mês, enquanto ElevenLabs.io oferece serviços de tradução gratuitos com certas limitações. Isto indica o custo potencial e a complexidade envolvidos na implementação de tal recurso.
A tradução automática de páginas da web já é um recurso bem conceituado em navegadores da web. A adição de conteúdo de vídeo traduzido ou dublado em tempo real pode diferenciar o Edge de seus concorrentes, atraindo potencialmente mais usuários para o navegador. Esse novo recurso ressalta o compromisso da Microsoft em aproveitar a IA para melhorar a acessibilidade e a experiência do usuário em seus produtos.