A IA de estabilidade lançou o estável Audio 2.5, uma nova ferramenta de áudio de AI construída para uso comercial. Lançado em 10 de setembro, o modelo marca um grande salto em velocidade, gerando faixas de três minutos em menos de dois segundos. Esta atualização ajuda as empresas a criar som personalizado em escala para anúncios, jogos e experiências de marca. Para apoiar seu foco corporativo, a estabilidade da IA ​​fez uma parceria com o Sound Agency AMP. Treinado em um conjunto de dados totalmente licenciado, a ferramenta é comercialmente segura, resolvendo um problema essencial para as empresas. Target=”_ Blank”> Release Continua a evolução da AI no espaço de áudio. Segue-se o lançamento inicial da plataforma em setembro de 2023 e a atualização da versão 2.0 em abril de 2024. A empresa também lançou um modelo no dispositivo com o ARM em maio de 2025, concentrando-se em áudio sem royalties. e controle criativo

O núcleo do estável Audio 2.5 é um novo método de pós-treinamento chamado adversário contrastivo relativístico (ARC). Essa inovação aumenta drasticamente a eficiência. Ele reduz as etapas computacionais necessárias para a geração de 50 na versão anterior para apenas oito. He told VEntureb, “the Adversarial Relativistic-Contrastive (ARC) method is a post-training technique that sidesteps traditional approaches requiring teacher models, distillation, or Orientação sem classificador,”destacando sua saída de métodos mais intensivos em recursos. Essa eficiência se traduz diretamente na velocidade, permitindo a iteração rápida para profissionais criativos.

Além da velocidade bruta, o modelo apresenta a pintura de áudio. Esse recurso permite que os usuários inseram um arquivo de áudio existente, selecione uma seção específica e peça à IA que gera novo conteúdo que se encaixa no contexto. Isso oferece um nível de controle granular anteriormente indisponível na ferramenta.

Composições musicais também são mais sofisticadas. O modelo agora produz faixas com estruturas mais claras, como introdução, desenvolvimento e outro. Isso aborda uma crítica comum à música da IA, onde os resultados podem parecer repetitivos ou sem rumo. Apenas como gerador de áudio, mas como uma ferramenta fundamental para criar identidades sonoras únicas e consistentes. de canais. Isso inclui tudo, desde s tradicional e os créditos de abertura de um jogo até a música ambiente em uma loja de varejo ou os sinos sutis de um toque de cartão de crédito. Diferenciador: ajuste fino. A equipe da empresa pode trabalhar com uma organização para treinar uma versão sob medida do modelo em sua biblioteca de som existente.

Esse processo incorpora o áudio de assinatura de uma marca diretamente em seus fluxos de trabalho generativos. O resultado é que qualquer música ou paisagem sonora produzida é exclusivamente reconhecível e se alinha perfeitamente com as diretrizes sonoras estabelecidas da marca, garantindo a consistência em todos os pontos de contato. A colaboração é mais do que um simples endosso; É uma iniciativa de co-desenvolvimento que visa criar soluções inovadoras para marcas de primeira linha. Evolução fundamental do objetivo da plataforma. áudio, desempenho mais rápido e controle avançado necessário para casos de uso comercial…”. Isso ressalta a ambição da empresa de fazer a transição de áudio estável de uma ferramenta de consumidor promissora para uma plataforma robusta e indispensável para profissionais criativos e marcas globais. Empresas como Adobe, Microsoft e Elevenlabs lançaram poderosas ferramentas de geração de áudio. Cada um está disposto a dominar em um espaço cheio de desafios éticos e de oportunidade. Ele fornece segurança comercial e ajuda os clientes a evitar os processos de violação de direitos autorais que atormentaram outras empresas de IA. Essa garantia legal é fundamental para a adoção da empresa.

No entanto, a indústria permanece cautelosa quanto ao potencial de uso indevido. A NVIDIA, por exemplo, desenvolveu seu modelo avançado de fugatto, mas até agora reteve uma liberação pública sobre essas preocupações. Aplicações ainda mais avançadas. Evans sugeriu no futuro, dizendo: “Nosso recente artigo de pesquisa destaca as possibilidades criativas à frente, da geração musical em tempo real a design de som interativo, com músicas que se adaptam dinamicamente ao seu público”, referenciando-se a