Un equipo de investigadores de HKUST y M-A-P ha lanzado Yue, una familia de modelos de IA de código abierto capaces de generar canciones de cinco minutos de larga duración a partir de letras de texto just. Announced alongside a technical paper on arXiv, YuE enters an industry facing intense legal scrutiny.

YuE is Disponible a través de GitHub bajo un permisivo apache 2.0 licencia . Este movimiento tiene como objetivo fomentar la innovación transparente en la creación de música de IA, ofreciendo una alternativa poderosa y legalmente accesible para artistas y desarrolladores.

bajo el capó: cómo Yue genera canciones de larga duración

construida en la arquitectura de Llama 2 y capacitada en trillones de tokens de tokens, la habilidad de Yue, la capacidad de coherencia de una coherencia de más de minutos, construida en la arquitectura de Llama 2 y capacitada en trillones de tokens de tokens, la habilidad de Yue, la capacidad de coherencia de varios minutos. Los investigadores atribuyen esto a varias innovaciones arquitectónicas detalladas en su papel .

Una técnica clave es la”predicción de siguiente tiempo decotado en pista”. Esto permite que el modelo procese voces y acompañamientos como transmisiones paralelas separadas. Esto evita que las secciones instrumentales densas, comunes en géneros como el metal, por abrumador y distorsionando la pista vocal, asegurando la claridad lírica.

para mantener la coherencia a largo plazo, Yue emplea”acondicionamiento progresivo estructural”. Al dividir una canción en segmentos lógicos como [verso] y [coro], el modelo se centra en mantener la consistencia melódica dentro de cada sección antes de pasar a la siguiente, evitando la degradación de la calidad en secuencias largas.

El modelo también muestra una capacidad sofisticada de aprendizaje en el contexto (ICL). Los usuarios pueden proporcionar un clip de audio corto para guiar el estilo, permitiendo la clonación de voz de alta fidelidad y las transferencias de estilo de flexión de géneros. página de demostración oficial presenta ejemplos impresionantes de técnicas vocales avanzadas no capacitadas explícitamente, como acolchado, gruñidos de muerte, y con problemas de inicio de la muerte múltiple en una parte de las armonías de cappilla.

un challinge abre-shallen en un lugar de la muerte múltiple en el legal de la muerte en un lugar de la muerte en un lugar de la muerte. El debut de Field

Yue se produce cuando AI Music World lucha con cuestiones legales fundamentales. En junio de 2024, el RIAA intensificó el conflicto demandando a Suno y Udio por infracción masiva de derechos de autor. El presidente y CEO de RIAA, Mitch Glazier, advirtió que”los servicios sin licencia como Suno y Udio que afirman que es”justo”copiar el trabajo de la vida de un artista… establece la promesa de una IA genuinamente innovadora para todos nosotros”. escala masiva”. Ambas compañías han defendido su tecnología bajo la doctrina de”uso justo”, con el CEO de Suno, Mikey Shulman, afirmando que su modelo fue”… diseñado para generar resultados completamente nuevos, no memorizar y regurgitar el contenido preexistente”.

La batalla legal sigue activa, aunque las principales etiquetas de registro como Universal, Sony, y Warner están informados ahora en las conversaciones de licencias. En medio de esta incertidumbre, otros jugadores están trazando un curso más cauteloso. La startup de Voice AI Elevenlabs lanzó recientemente su propia herramienta, Once Music, basada en una estrategia de”licencia primero”. El CEO Mati Staniszewski enfatizó que”el modelo se crea estrictamente en datos a los que tenemos acceso”. La industria permanece profundamente dividida sobre cómo proceder, obligando a las plataformas y compañías tecnológicas a elegir sus estrategias con cuidado.

Los gigantes tecnológicos están pisando cuidadosamente. Music’s Music Ai Sandbox de agua de Google marca todas sus salidas para garantizar la trazabilidad. Nvidia dio un paso aún más conservador, presentando su poderoso modelo de audio Fugatto pero reteniendo su liberación pública. El vicepresidente de una compañía, Bryan Catanzaro, señaló que”cualquier tecnología generativa siempre conlleva algunos riesgos, porque las personas podrían usar eso para generar cosas que preferiríamos no”.

Las plataformas de transmisión también están dibujando líneas. Spotify confirmó que permitiría la música de IA, pero la policía de las suplantaciones de voz no autorizadas, mientras que Universal Music y Deezer anunciaron previamente un modelo”centrado en el artista”para priorizar a los creadores humanos en los cálculos de regalías.

Esta precaución refleja una ansiedad más amplia dentro de la comunidad creativa. Mientras que algunos artistas adoptan la IA como una herramienta de colaboración, otros temen que devalúa el arte humano. Este sentimiento fue capturado por la autora Joanna Maciejewska, quien dijo:”Quiero que Al haga mi lavandería y platos para que pueda hacer arte y escribir, no para que Al haga mi arte y escriba para que pueda lavar mi lavandería y platos”. Target=”_ Blank”> Herramienta de código abierto , sus creadores están haciendo una declaración deliberada. Apuestas a que la transparencia y el desarrollo impulsado por la comunidad, en lugar de los litigios de puertas cerradas, definitivamente definirán el futuro de la IA en la música.

Categories: IT Info