A Shutterstock revelou um modelo de licenciamento ético projetado para remodelar a forma como os desenvolvedores de IA acessam dados de treinamento de alta qualidade.
A nova licença de pesquisa da Shutterstock permite que startups de IA e pequenos desenvolvedores treinem sistemas de IA de maneira acessível e responsável. Sua primeira aplicação está alimentando o LTXV (LTX Video), um modelo de geração de vídeo em tempo real desenvolvido por Lightricks.
Ao utilizar a vasta biblioteca de vídeos HD e 4K da Shutterstock, a Lightricks pretende superar barreiras técnicas na produção de vídeos com IA e, ao mesmo tempo, aderir aos padrões éticos. Com uma vasta biblioteca de mais de 800 milhões de imagens e 55 milhões de videoclipes, A Shutterstock atende atualmente aproximadamente 4,1 milhões de clientes ativos
“Muitas empresas e instrutores modelo seguiram o caminho da coleta não autorizada de dados [em vez de] fazer o investimento necessário para alcançar a qualidade e o nível de confiança necessários para desenvolver modelos comercialmente viáveis”, disse Daniel Mandell, chefe global de licenciamento de dados e IA da Shutterstock.
“No entanto, não achamos que o investimento financeiro deva ser uma barreira para quem deseja entrar neste espaço com uma abordagem ética.”
Relacionado: OpenAI lança Sora AI Video Generator para assinantes ChatGPT Plus e Pro
Licença de pesquisa da Shutterstock: um modelo de licenciamento em duas fases
A licença de pesquisa da Shutterstock introduz uma estrutura de licenciamento em duas fases destinado a fazer face aos custos proibitivos associados à formação em IA. Na fase inicial, os desenvolvedores podem experimentar conjuntos de dados menores para teste e validação.
Quando seus projetos estiverem prontos para comercialização, eles poderão fazer a transição para licenças comerciais completas. Essa abordagem flexível foi projetada para reduzir as barreiras financeiras à entrada de startups e organizações menores.
Mandell enfatizou que a Shutterstock pretendia estabelecer padrões éticos no desenvolvimento de IA e garantir uma remuneração justa para os criadores de conteúdo.
Um dos desafios mais persistentes na geração de vídeo por IA é manter movimentos suaves e coerentes entre quadros, especialmente em clipes mais longos. A arquitetura do LTXV foi projetada especificamente para resolver esse problema. Ao treinar nos diversos conjuntos de dados de vídeo de alta qualidade da Shutterstock, o LTXV atinge um nível de consistência de movimento que o diferencia dos modelos concorrentes.
“Os dados da Shutterstock nos permitem treinar modelos de forma responsável e ética”, disse Zeev Farbman , CEO da Lightricks. “Essa parceria garante que respeitamos os direitos criativos e, ao mesmo tempo, impulsionamos os recursos técnicos de nossas ferramentas.”
Relacionado: Meta apresenta Video Seal Framework para Hidden. Marcas d’água de vídeo de IA
Remuneração justa para colaboradores
Os colaboradores da plataforma da Shutterstock se beneficiam de um modelo de participação na receita, recebendo 20% da receita gerada pelo licenciamento de dados acordos. Além disso, os criadores de conteúdo podem optar por não ter seu trabalho usado para fins de treinamento em IA, uma escolha exercida por menos de 1% dos colaboradores da Shutterstock.
Mandell atribui essa baixa taxa de cancelamento à transparência e justiça do modelo de licenciamento.
A iniciativa posiciona a Shutterstock como um impulsionador da promoção de práticas éticas de IA em um momento em que a indústria enfrenta um escrutínio crescente sobre a fonte de dados. Vários processos judiciais foram movidos contra empresas de IA acusadas de usar material protegido por direitos autorais em seus conjuntos de dados de treinamento sem autorização.
Relacionado: Amazon revela modelos de IA multimodais Nova para texto, imagem e vídeo
Capacidades do LTXV: geração de vídeo por IA em tempo real
LTXV, desenvolvido pela Lightricks, pode produzir vídeos mais rápido que a velocidade de reprodução, gerando 24 quadros por segundo e entregando vídeos de alta resolução em apenas 30 segundos em hardware de última geração.
LTXV oferece vários modos de operação, incluindo geração de texto para vídeo, imagem para vídeo e vídeo para vídeo. Esses recursos permitem que os criadores gerem animações, transformem filmagens existentes ou criem vídeos inteiramente novos com base em instruções descritivas. A flexibilidade dessas ferramentas torna o LTXV acessível tanto para cineastas profissionais quanto para criadores independentes.
Imagem: lightricks/LTXV
Inovações técnicas
O modelo é construído em uma arquitetura Diffusion Transformer (DiT) com dois bilhões de parâmetros, o que permite obter transições suaves entre quadros e manter a consistência em clipes estendidos.
A resolução de saída padrão do LTXV é 768×512, mas pode ser ampliada até 720×1280, mantendo o desempenho. Ao contrário de muitos modelos de IA, que exigem infraestrutura poderosa, o LTXV pode operar de forma eficiente em GPUs de consumo com apenas 6 GB de VRAM, ampliando sua acessibilidade para estúdios menores e desenvolvedores individuais.
Relacionado: Google Vertex AI agora oferece gerador de vídeo Veo AI e modelo de texto para imagem Imagen 3
Craig Andrews, gerente global de relações públicas da Lightricks, afirmou que a consistência do movimento era um dos maiores desafios técnicos em IA vídeo geração e explicou que a videoteca da Shutterstock desempenhou um papel essencial na solução desse problema.
Imagem: lightricks/LTXV
LTXV é lançado sob o Apache 2.0 licença, disponibilizando-o gratuitamente para modificação, uso e redistribuição. Esta estrutura de código aberto incentiva a colaboração entre desenvolvedores e pesquisadores, ao mesmo tempo que garante acessibilidade para criadores independentes e pequenas empresas. O modelo está hospedado no GitHub e no Hugging Face, onde já foi baixado milhares de vezes.
Além da disponibilidade de código aberto, o LTXV se integra a plataformas como ComfyUI, permitindo aos usuários personalizar e adaptar seus recursos às necessidades específicas. Esse nível de flexibilidade torna o LTXV uma ferramenta valiosa tanto para especialistas técnicos quanto para profissionais criativos.
Relacionado: Adobe revela ferramentas de vídeo de IA no Premiere Pro e expande o Firefly
A capacidade do LTXV de gerar clipes estendidos com qualidade consistente o torna altamente escalável para diversas aplicações. Do comércio eletrônico interativo e publicidade ao desenvolvimento de jogos e criação de conteúdo, a versatilidade do modelo abre novas possibilidades para os criadores. Sua compatibilidade com GPUs de consumo amplia ainda mais seu apelo, garantindo que até mesmo pequenos estúdios possam aproveitar seus recursos.
A estrutura de licenciamento da Shutterstock oferece uma alternativa compatível que beneficia tanto desenvolvedores quanto criadores de conteúdo. Ao aproveitar os conjuntos de dados de origem ética da Shutterstock, a LTXV exemplifica como a inovação de código aberto pode se alinhar às práticas éticas.