A Adobe expandiu sua plataforma de IA generativa do Firefly com uma nova ferramenta”Gereate Effects Sound”, que entrou na versão beta em 17 de julho. O recurso, disponível no firefly Prompts. Este lançamento faz parte da estratégia mais ampla da Adobe para construir um kit de ferramentas completo e comercial completo. src=”https://winbuzzer.com/wp-content/uploads/2025/07/adobe-firefly-sound-effects.jpg”>
de’whoosh’para o som: uma nova maneira de gerar áudio
href=”https://blog.adobe.com/en/publish/2025/07/17/firefly-adds-new-Video-capabilities-industry-liading-AI-Models-genate-genate-efeitos”Target=”_”> New Generate Sound Efeitos Em vez de confiar apenas no texto, os criadores agora podem fornecer pistas vocais para moldar a saída de áudio final. Este rendimento liderado por áudio foi provocado pela primeira vez em Adobe Sonic Experimento .
Precisamente onde eles pertencem a uma linha do tempo em vídeo. Esse fluxo de trabalho inovador tem como objetivo preencher a lacuna entre a intenção de um criador e a interpretação da IA, um ponto de atrito comum nas ferramentas generativas. A Adobe também introduziu a”referência de composição”, um recurso que permite aos usuários fazer upload de um vídeo de referência para refletir sua composição em um novo clipe gerado pela AI. Isso oferece aos criadores mais controle sobre o enquadramento e a consistência da tiro. Em um aceno para a crescente demanda por conteúdo escalável, a Adobe também lançou”Text to Avatar (Beta)”, que transforma scripts em vídeos liderados por um apresentador digital. O líder generativo da IA da Adobe, Alexandru Costin, sugeriu que”controles e predefinições semelhantes podem estar disponíveis para uso com modelos de IA de terceiros no futuro”, sinalizando um futuro em que o Firefly atua como um hub central para várias tecnologias generativas. um campo ferozmente competitivo. A Elevenlabs lançou sua própria ferramenta de efeitos sonoros em junho de 2024, enfatizando o uso de dados de origem ética por meio de uma parceria com a Shutterstock.
Enquanto isso, a estabilidade AI e o ARM lançaram um modelo de código aberto, em maio de 2025, concentrando-se no áudio sem royalties para evitar disputas de direitos autorais. A Meta in 2023 lançou o Audiocraft, uma plataforma de IA generativa que permite aos usuários criar músicas originais e conteúdo de áudio com apenas alguns cliques.
O setor permanece cauteloso, no entanto. A Nvidia apresentou seu modelo avançado de fugatto em novembro de 2024, mas retirou sua liberação pública sobre preocupações éticas. Bryan Catanzaro, um vice-presidente de nvidia,