A ElevenLabs lançou Projects, uma ferramenta baseada em IA destinada a simplificando a geração e edição de áudio de formato longo, como audiolivros. Ele se baseia na pesquisa da empresa em síntese de fala de formato longo, condicionamento de áudio e geração de áudio paralelizado.

[conteúdo incorporado]

Enfrentando desafios anteriores do usuário

Antes da introdução dos Projetos, os usuários relataram desafios como problemas de estabilidade ao produzir conteúdo estendido e dificuldades na fusão de fragmentos de texto falados por vozes diferentes. As limitações anteriores da plataforma também dificultavam a regeneração de seções de áudio específicas e restringiam os usuários a determinados formatos de arquivo de texto.

O Projects busca abordar essas preocupações oferecendo recursos como:

Geração de audiolivros inteiros com um clique. Atribuir fragmentos de texto a falantes específicos, mantendo o contexto. Ajustando a duração das pausas para ritmo. Regeneração seletiva de fragmentos de áudio sem refazer sequências inteiras. Suporte para formatos de arquivo.epub,.pdf,.txt e início de projeto baseado em URL.

Recursos e compatibilidade

A ferramenta oferece uma variedade de recursos, incluindo recursos completos de conversão, atribuição de alto-falante, regeneração de segmento, ajustes manuais de pausa, segmentação de capítulo e salvamento e função de retomada. Ele também suporta a importação de arquivos de vários formatos e URLs.

Em termos de compatibilidade, o Projects se integra às ferramentas existentes do ElevenLabs, como Speech Synthesis, VoiceLab e Voice Library. Além disso, funciona em conjunto com Clonagem de Voz Profissional, Biblioteca de Voz e modelo multilíngue da ElevenLabs.

Categories: IT Info