Meta, la empresa matriz de Facebook, ha anunciado el desarrollo de un nuevo modelo de inteligencia artificial (IA) generativa llamado Voicebox. El modelo de inteligencia artificial de última generación está diseñado para realizar una variedad de tareas de generación de voz, incluidas la edición, el muestreo y el estilo, incluso si no se entrenó específicamente para estas tareas.

Voicebox: un modelo de IA multilingüe

Voicebox es capaz de producir clips de audio de alta calidad y editar audio pregrabado, como eliminar ruidos no deseados como bocinas de autos o ladridos de perros, todo mientras preservando el contenido y el estilo del audio. El modelo también es multilingüe, capaz de producir voz en seis idiomas: inglés, francés, alemán, español, polaco y portugués.

“Voicebox puede producir una lectura del texto en cualquiera de esos idiomas, incluso cuando el discurso de muestra y el texto están en diferentes idiomas. Esta capacidad podría usarse en el futuro para ayudar a las personas a comunicarse de una manera natural y auténtica, incluso si no hablan los mismos idiomas”, dice el anuncio oficial de Meta.

Presentamos Voicebox, un nuevo sistema de voz generativo innovador basado en Flow Matching, un nuevo método propuesto por Meta AI. Puede sintetizar voz en seis idiomas, elimina ruido, edita contenido, transfiere estilo de audio y más.

Más detalles sobre este trabajo y ejemplos ⬇️

— Meta AI (@MetaAI) 16 de junio de 2023

Posibles aplicaciones de Voicebox

Las aplicaciones potenciales de Voicebox son amplias. Podría dar voces con un sonido natural a los asistentes virtuales y personajes que no son jugadores en el metaverso. También podría permitir que las personas con discapacidad visual escuchen mensajes escritos de amigos leídos por IA en sus voces Además, podría proporcionar a los creadores nuevas herramientas para crear y editar fácilmente pistas de audio para videos y mucho más.

Gran avance para la edición de audio

Una de las características más impresionantes de Voicebox es su capacidad para editar y reducir el ruido en los clips de audio. El modelo de IA puede recrear una parte del discurso que se interrumpe por el ruido o reemplazar las palabras mal pronunciadas sin tener que volver a grabar un discurso completo.

“Por ejemplo, puede identificar un segmento de un discurso que se interrumpe por un perro ladrando, recórtelo e indíquele a Voicebox que regenere ese segmento, como un borrador para la edición de audio”, dice la compañía.

Voicebox representa otro importante paso adelante en la investigación de IA generativa. Ilustra el potencial de la IA para transformar la forma en que interactuamos con la tecnología y entre nosotros. A medida que Meta continúa explorando el espacio del audio, la comunidad tecnológica espera ansiosamente ver cómo otros investigadores se basarán en este trabajo innovador.

Meta e IA: Desarrollos recientes

El 31 de marzo de 2023, Meta anunció un proyecto que le da a los robots”ojos”a través de una corteza visual artificial. Este proyecto, llamado SEER (Self-supervised), es un modelo de visión por computadora que puede aprender de cualquier grupo aleatorio de imágenes en Internet, lo que representa un cambio significativo con respecto a los modelos anteriores que requerían conjuntos de datos etiquetados manualmente. Esta tecnología podría revolucionar potencialmente la forma en que la IA entiende e interactúa con el mundo visual.

El 20 de mayo de 2023, Meta presentó CodeCompose, una herramienta de codificación impulsada por IA similar a GitHub Copilot. CodeCompose es un asistente de codificación generativo basado en IA desarrollado para que los desarrolladores sean más productivos a lo largo del ciclo de vida del desarrollo de software. La herramienta ofrece sugerencias de código para varios idiomas a medida que los desarrolladores escriben en entornos de desarrollo integrados (IDE) como VS Code.

El 6 de junio de 2023, surgieron imágenes filtradas que insinúan el desarrollo de un chatbot de IA por parte de Instagram. Estos”agentes de IA”podrán responder preguntas o brindar consejos a los usuarios, con la opción de elegir entre 30 personalidades de IA diferentes. El desarrollo de este chatbot de IA parece ser una respuesta al comportamiento cambiante del usuario, con más conversaciones en Instagram. a los mensajes directos.

El 9 de junio de 2023, el CEO de Meta, Mark Zuckerberg, anunció planes para integrar IA generativa en sus productos insignia, como Facebook e Instagram. Se espera que este movimiento transforme la forma en que creamos, compartimos, y experiencia de contenido. Zuckerberg también mencionó el desarrollo de personajes de IA que pueden ayudar a los usuarios de varias maneras.

El 14 de junio de 2023, Meta anunció un nuevo modelo de creación de imágenes de IA llamado I-JEPA. o Image Joint Embedding Predictive Architecture, está diseñado para crear imágenes realistas a partir de descripciones de texto. Esta tecnología podría usarse para una variedad de propósitos, incluida la creación de materiales de marketing, el diseño de productos y la generación de arte.

Categories: IT Info