ElevenLabs ha presentado Projects, una herramienta basada en IA destinada a simplificando la generación y edición de audio de formato largo como audiolibros. Se basa en la investigación de la empresa sobre síntesis de voz de formato largo, acondicionamiento de audio y generación de audio en paralelo.
[contenido integrado]
Abordar los desafíos de los usuarios anteriores
Antes de la introducción de Proyectos, los usuarios reportaron desafíos como problemas de estabilidad al producir contenido extendido y dificultades para fusionar fragmentos de texto pronunciados por diferentes voces. Las limitaciones anteriores de la plataforma también dificultaban la regeneración de secciones de audio específicas y restringían a los usuarios a ciertos formatos de archivos de texto.
Projects busca abordar estas preocupaciones ofreciendo funciones como:
Generación de audiolibros completos con un solo clic. Asignar fragmentos de texto a hablantes específicos manteniendo el contexto. Ajustar la duración de las pausas para el ritmo. Regeneración selectiva de fragmentos de audio sin rehacer secuencias enteras. Compatibilidad con formatos de archivo.epub,.pdf,.txt e inicio de proyectos basado en URL.
Funciones y compatibilidad
La herramienta proporciona una variedad de funciones, que incluyen capacidades de conversión completa, asignación de oradores, regeneración de segmentos, ajustes de pausa manuales, segmentación de capítulos y función para guardar y función de reanudación. También admite la importación de archivos desde varios formatos y URL.
En términos de compatibilidad, Projects se integra con las herramientas existentes de ElevenLabs, como Speech Synthesis, VoiceLab y Voice Library. Además, funciona en conjunto con Professional Voice Cloning, Voice Library y el modelo multilingüe de ElevenLabs.