Estabilidad AI, en asociación con Chip Designer Arm, anunciado el 14 de mayo de 2025, el lanzamiento de código abierto de Audio Open Stable Open Small, un modelo de inteligencia artificial de texto a audio compacto y eficiente. Este modelo de IA estéreo está específicamente optimizado para ejecutarse completamente en las CPU ARM, lo que permite capacidades de audio generativas directamente en dispositivos como teléfonos inteligentes sin depender del procesamiento en la nube. El lanzamiento es significativo ya que tiene como objetivo democratizar la creación de audio para una gama más amplia de usuarios y aplicaciones, al tiempo que aborda las preocupaciones de propiedad intelectual al estar capacitados exclusivamente en audio libre de regalías. href=”https://stability.ai/news/stability-ai-and-arm-release-stable-audio-open-small-enabling-real-world-deployment-for-on-dedevice-audio-confontrol”Target=”_ en blanco”> anuncio oficial , presenta 341 millones de parámetros y puede producir hasta 11 segundos de audio en un Smartelio de Smartio. Este rendimiento se basa en un avance previamente anunciado con el brazo en el congreso del mundo móvil 2025, donde las optimizaciones con las bibliotecas de las bibliotecas de las armadas de las armadas. Akkaraju, CEO de Stability AI, destacó este logro anterior, indicando”gracias a estas optimizaciones de modelos y Kleidiai del brazo, nos mudamos de minutos a unos segundos para generar audio completamente en la CPU del brazo en el teléfono inteligente”. El Audio Estable Estable actual aprovecha pequeños de estos avances, lo que hace que sea accesible sin requisitos de hardware pesados, como la estabilidad AI Noticias de noticias.

El compromiso de la compañía con un enfoque ético está subrayado por su uso del uso del archivo de música gratuito y el freesound para capacitación, un accesorios de los competidores, como Suno, que se han abierto a Suno, que se han visto a Suno. Permisive estabilidad ai licencia comunitaria , con pesos de modelo disponibles en github , y su artículo de investigación publicado en arxiv . An Path de aprendizaje de brazo También está disponible para guiar a los desarrolladores.

en el audio: capacidades: capacidades y consideraciones Strong.

Audio estable Abrir el procesamiento en el dispositivo de Small ofrece velocidad y funcionalidad fuera de línea, un diferenciador clave de muchos servicios de generación de audio dependientes de la nube. Mientras que se diseñan principalmente para muestras de audio cortas como efectos de sonido o riffs musicales, la IA de estabilidad reconoce ciertas limitaciones. El modelo actualmente admite solo las indicaciones en inglés y aún no está optimizado para generar voces altamente realistas o canciones complejas de longitud completa.

Además, como se indica en su documentación e informada por TechCrunch, los datos de capacitación tienen un sesgo occidental, lo que puede afectar su rendimiento en diversos estilos musicales globales. Los términos de licencia están estructurados para fomentar una amplia adopción: es gratuito para investigadores, aficionados y empresas que ganan menos de $ 1 millón anualmente. Sin embargo, las entidades más grandes que exceden este ingreso necesitarán una Licencia empresarial Desde la estabilidad ai.

navegar por los desafíos de Audio y IP de Audio de AI. Un movimiento estratégico en una industria se centró cada vez más en los derechos de propiedad intelectual. Esto contrasta con otras herramientas de audio de IA, algunas de las cuales han enfrentado acciones legales de sellos discográficos para supuestamente usar música con derechos de autor sin una autorización adecuada. Al utilizar datos con licencia abiertamente, la AI de estabilidad tiene como objetivo proporcionar una base más legalmente sólida para los creadores.

El campo de audio de IA más amplio es dinámico, con compañías como ElevenLabs que han lanzado herramientas para efectos de sonido en junio de 2024, enfatizando los datos de origen ético a través de asociaciones. Nvidia también presentó su modelo avanzado de audio Fugatto en noviembre de 2024, aunque no se ha publicado públicamente debido a las preocupaciones sobre el mal uso potencial, lo que refleja un enfoque cauteloso para las poderosas tecnologías generativas. Más recientemente, Google introdujo su modelo de IA de texto a música de Lyria en abril, principalmente para sus clientes empresariales, sin embargo, como señaló WinBuzzer, los detalles sobre sus conjuntos de datos de capacitación no se especificaron.

El lanzamiento de la liberación de Audio Open Small Represents Anotsolution de la actualización en curso de la actualización de la costa de la costa de la costa de la costa de la costa. El lanzamiento inicial de su plataforma de audio estable en septiembre de 2023. Esa iteración anterior, desarrollada con datos de Audiosparx , centrado en la generación basada en la nube. Sin embargo, esta nueva versión”pequeña”prioriza claramente la eficiencia y la implementación en el dispositivo, alineándose con la tendencia de la industria hacia Edge Ai.

Este lanzamiento se produce como estabilidad AI, conocida por su popular difusión estable generador de imágenes, continúa navegando por un mercado competitivo. La compañía ha experimentado cambios de reestructuración financiera y liderazgo, ya que ha recaudado nuevo efectivo el año pasado.

La introducción de un modelo en el dispositivo con capacitación ética como el audio estable abierto pequeño, otros lanzamientos de modelo de generación de imágenes recientes, indica un esfuerzo estratégico para innovar y solidificar su posición de mercado. La combinación de accesibilidad, rendimiento en el dispositivo y una base de datos libre de regalías podrían hacer que el audio estable se abra pequeño una opción atractiva para desarrolladores y creadores.

Categories: IT Info