A Midjourney lançou a versão alfa do Midjourney V6, introduzindo melhorias nas imagens geradas por IA. A empresa, conhecida por seus modelos de IA, deu um grande salto em frente com recursos que incluem a geração de texto legível em imagens e renderizações mais realistas e detalhadas.

Recursos e prompts inovadores

De acordo com o CEO da Midjourney David Holz, o V6 é o terceiro modelo desenvolvido do zero nos superaglomerados de IA do coletivo e tem evoluiu ao longo de nove meses de desenvolvimento dedicado. Com a promessa de maior precisão na adesão imediata e coerência geral, os usuários também são recebidos com novos métodos de solicitação. Midjourney se afastou dos estilos de prompts técnicos das versões anteriores, exigindo que os usuários aprendessem uma abordagem nova e mais sensível para gerar os resultados desejados. Holz enfatiza a remoção de textos”indesejados”e incentiva os usuários a serem explícitos em suas solicitações para obter resultados mais precisos.

Adaptação do usuário e insights de desenvolvimento

As é típico de novas iterações de tecnologia, pode levar algum tempo para que os usuários se adaptem ao modelo atualizado. Embora um subconjunto de usuários tenha elogiado o V6 por seus avanços, os testes individuais iniciais revelam que as atualizações podem não ser imediatamente perceptíveis para todos, mas o potencial de refinamento e criatividade é palpável. Embora alguns recursos da V5.2 estejam atualmente ausentes, há planos para incluí-los em versões futuras da V6, indicando que o Midjourney V6 não é o estágio final, mas um passo em direção a uma integração mais profunda com os processos criativos dos usuários.

O lançamento do Midjourney V6 despertou entusiasmo na comunidade artística de IA, demonstrando o compromisso do coletivo em impulsionar os limites da criatividade impulsionada pela IA. Embora a ferramenta enfrente os desafios habituais inerentes às tecnologias de arte de IA, incluindo discussões jurídicas em curso sobre o treinamento de tais modelos, Midjourney continua a afirmar a sua posição de liderança no cenário competitivo da geração de arte de IA.

Outras IA notáveis Geradores de imagens

OpenAI também introduziu o ShapE, um modelo generativo que pode criar modelos 3D a partir de texto, abrindo novas possibilidades para IA na criação de imagens. A empresa também lançou recentemente seu modelo artístico de geração de imagens DALL-E 3. A Microsoft faz parceria com a OpenAI para trazer o Bing Image Creator, que foi recentemente integrado ao DALL-E 3. A Stability AI, uma startup que se concentra em IA generativa, lançou o StableStudio, um aplicativo da web de código aberto que usa seu modelo de difusão estável para gerar imagens de prompts de texto. Os usuários também podem usar os recursos do DreamStudio para fazer diversas variações de uma imagem com diferentes estilos e atributos. A Meta, empresa anteriormente conhecida como Facebook, já está nesse campo e lançou o I-JEPA, seu próprio gerador de imagens de IA baseado em seu modelo de transformador generativo. O I-JEPA pode aprender as associações entre palavras e imagens e gerar imagens realistas a partir de descrições de texto. Alibaba, gigante chinesa do comércio eletrônico, lançou o Tongyi Wanxiang, um gerador generativo de imagens de IA que pode lidar com os idiomas chinês e inglês. Os usuários podem personalizar os parâmetros de saída da imagem usando o Composer, um grande modelo desenvolvido pela Alibaba Cloud. A gigante dos chips Nvidia estreou sua ferramenta de criação de arte Perfusion AI em agosto.

Categories: IT Info