Estabilidade AI, a empresa líder mundial em generative AI, lançou recentemente seu Stable Animation SDK, uma nova ferramenta que permite desenvolvedores para criar e animar modelos 3D usando comandos de linguagem natural. O SDK é alimentado pelo modelo principal da Stability AI, Stable Diffusion, um gerador de texto para imagem que pode produzir imagens realistas e diversificadas a partir de qualquer entrada de texto.
O Stable Animation SDK permite que os usuários gerem facilmente modelos 3D de qualquer objeto, personagem ou cena simplesmente descrevendo-os em palavras. Por exemplo, pode-se escrever”um dragão com escamas vermelhas e olhos verdes”e obter um modelo 3D de um dragão que corresponda à descrição. Os usuários também podem modificar os modelos adicionando ou alterando atributos, como cor, forma, tamanho, textura , pose e muito mais.
Mas o SDK não para na geração de modelos estáticos. Ele também permite que os usuários os animem usando comandos de linguagem natural. Por exemplo, pode-se escrever”faça o dragão cuspir fogo”ou”faça o dragão voar”e veja o modelo ganhar vida com movimentos e efeitos realistas. Os usuários também podem controlar o ângulo da câmera, a iluminação, o plano de fundo e outros aspectos da animação.
O Stable Animation SDK foi projetado para ser fácil de usar e integrar-se a aplicativos e plataformas existentes. Os usuários podem acessar o SDK por meio do Stability AI’s API de plataforma, que fornece uma interface simples para interagir com os modelos de Stability AI. Os usuários também podem usar os plug-ins do Stability AI para softwares populares, como Photoshop e Blender, para gerar e editar modelos 3D e animações diretamente em suas ferramentas favoritas.
[conteúdo incorporado]
Em seu anúncio postagem no blog, Stability AI aponta para três maneiras diferentes que os usuários podem inserir na AI para gerar animações:
“Texto para animação: os usuários inserem um prompt de texto (como no Stable Diffusion) e ajustam vários parâmetros para produzir uma animação. Entrada de texto + entrada de imagem inicial: os usuários fornecem uma imagem inicial que atua como o ponto inicial de sua animação. Um prompt de texto é usado em conjunto com a imagem para produzir a animação de saída final. Entrada de vídeo + entrada de texto: os usuários fornecem um vídeo inicial para basear sua animação. Ajustando vários parâmetros, eles chegam a uma animação de saída final que também é guiada por um prompt de texto.”
O fundador e CEO da Stability AI, Emad Mostaque, disse:”Nossa missão é construir a base para ativar o potencial da humanidade. Com o Stable Animation SDK, estamos oferecendo aos usuários uma nova maneira de liberar sua criatividade e imaginação usando IA generativa. Estamos ansiosos para ver que coisas incríveis as pessoas criarão com esta ferramenta.”
O Stable Animation SDK é agora disponível para testes beta para desenvolvedores selecionados. Os usuários interessados podem se inscrever no site da Stability AI para obter acesso antecipado e atualizações no SDK. Os usuários também podem saber mais sobre os outros produtos e serviços da Stability AI em seu site ou segui-los nas mídias sociais para obter as últimas notícias e anúncios.
A Stability AI é líder em inteligência de código aberto e pode superar o Google e a Microsoft
A Stability AI é uma empresa que fabrica ferramentas de IA de código aberto que qualquer pessoa pode usar. Ele cria modelos de IA para coisas diferentes, como imagens, palavras, sons, vídeos e muito mais. Ele também cria aplicativos e plug-ins que permitem que as pessoas usem seus modelos de IA facilmente. A empresa é a maior desenvolvedora de IA generativa de código aberto do mundo e usa o Ezra-1 UltraCluster, que é o quinto supercomputador mais poderoso do mundo. A empresa desenvolve o Stable Diffusion, um modelo de aprendizado de máquina que pode gerar imagens a partir de texto, modificar imagens com base em texto ou preencher detalhes em baixa resolução ou imagens com poucos detalhes.
No mês passado, relatamos o vazamento de um memorando interno do Google que destacava as preocupações da empresa de que provedores de código aberto, como Stability AI, superariam desenvolvedores privados, como Microsoft, OpenAI e Google. Essas empresas têm ferramentas de IA muito públicas, Bing Chat (Microsoft), ChatGPT (OpenAI) e Bard (Google).
O documento, que a Semianalysis diz ser genuíno e fornece informações profundas sobre a indústria de semicondutores, revela que o Google e a OpenAI são vulneráveis a serem superados por seus rivais de código aberto.
Ele afirma ,”Não temos fosso, nem OpenAI”. Ele também destaca as rápidas melhorias feitas por projetos de IA de código aberto, que sem dúvida foram mais inovadores do que Google e OpenAI nos últimos meses. O documento menciona vários feitos notáveis por open-source IA de origem, como executar modelos de base em um Pixel 6 a 5 tokens por segundo, ajustar a IA personalizada em um laptop à noite e criar modelos multimodais em tempo recorde.