A Stability AI revelou o Stable Audio, marcando seu primeiro passo para música baseada em IA e geração de som. Este novo produto aproveita IA generativa de ponta para produzir música de alta qualidade rapidamente por meio de uma interface online fácil de usar. Os usuários podem acessar uma versão básica gratuita do Stable Audio para criar e baixar clipes de música de até 20 segundos de duração. Além disso, está disponível uma assinatura’Pro’, que oferece faixas com duração de 90 segundos adequadas para aplicações comerciais.

Capacitando entusiastas e profissionais da música

Emad Mostaque, CEO da Stability AI, expressou o entusiasmo da empresa em aproveitar sua experiência para criar uma ferramenta que defenda os criadores musicais. Ele comentou: “Nossa esperança é que o Stable Audio capacite os entusiastas da música e os profissionais criativos a gerar novos conteúdos com a ajuda da IA, e estamos ansiosos pelas infinitas inovações que ele irá inspirar.”

A plataforma é não apenas adaptado para músicos que desejam produzir samples para suas composições, mas também apresenta possibilidades ilimitadas para todos os criadores. O recurso exclusivo do Stable Audio é sua capacidade de gerar faixas musicais em resposta a solicitações de texto descritivas fornecidas pelo usuário, juntamente com uma composição especificada. duração.

Uma mistura de tecnologia e criatividade

O Stable Audio se destaca por empregar as mais recentes técnicas de IA generativa, semelhantes às usadas na ferramenta de geração de imagens da Stability AI, Stable Diffusion. Claro, a principal diferença é que a IA está gerando áudio em vez de imagem.

O processo de geração de áudio utiliza um modelo de difusão, especificamente treinado em áudio, para criar novos clipes de áudio. Este modelo foi meticulosamente treinado usando música e metadados associados da AudioSparx, uma popular biblioteca de licenciamento de áudio. Esta colaboração visa produzir dividendos económicos e criativos para todas as partes interessadas envolvidas.

A distinção da plataforma reside na sua capacidade de produzir música de alta fidelidade, 44,1 kHz, adequada para fins comerciais através de difusão latente. Essa arquitetura condiciona o áudio com base em metadados de texto, duração do arquivo de áudio e horário de início, garantindo aos usuários maior controle sobre o conteúdo e a duração do áudio gerado.

Mercado crescente de IA de áudio

A Stability AI não é a única empresa que está explorando a IA de áudio. No mês passado, a Meta lançou o AudioCraft, uma plataforma de código aberto para a criação de áudio de IA.

Os usuários podem acessar o AudioCraft por meio de uma interface web ou aplicativo móvel e selecionar vários gêneros, ambientes, instrumentos e efeitos. Eles também podem enviar suas próprias amostras de áudio ou gravações e usá-las como entradas para a IA.

A plataforma pode gerar música e áudio para diversos fins, como podcasts, vídeos, jogos, anúncios ou pessoais. prazer. Os usuários também podem compartilhar suas criações com outros usuários da plataforma ou exportá-las para outros aplicativos ou dispositivos. O objetivo do AudioCraft é oferecer uma maneira fácil e divertida para qualquer pessoa criar música e áudio originais e de alta qualidade.

O Google também está no espaço de áudio de IA por meio de uma colaboração com a Universal Music. Especificamente, as duas empresas estão trabalhando em um sistema de licenciamento para músicas de IA. De acordo com o sistema proposto, os artistas concederiam ao Google e à Universal uma licença para usar suas vozes em músicas geradas por IA. Em troca, receberiam uma parte dos royalties gerados por essas músicas. O valor dos royalties seria baseado em vários fatores, incluindo a popularidade da música e o tempo de uso da voz do artista.

Categories: IT Info