OpeniAI na quarta-feira o acesso expandido à sua mais recente tecnologia de geração de imagens, tornando o modelo conhecido como”GPT-Image-1″disponível por meio de sua interface de programação de aplicativos (API). A API fornece recursos para produzir visuais fotorrealistas, alavancar o conhecimento mundial, seguir diretrizes personalizadas, controlar estilos, renderizar o texto dentro das imagens e executar ajustes interativos. entradas e transformá-las. 1535 × 1024 (paisagem). As opções de saída incluem formatos jpeg ou webp, juntamente com o suporte à transparência. nativamente multimodal… ele entende texto e imagens na sequência arbitrária.”

Isso permite tarefas de edição complexas, como modificar as imagens existentes com base na imagem original e em um novo texto de texto, ou usar técnicas de”mascaramento”, para alterar as regiões específicas, deixando outras pessoas que são utilizadas-apresenta um controle criativo. available via the Images API (with support in the Responses API coming soon), allowing developers and businesses to easily integrate high-quality image creation into apps and tools, with usage priced per token… pic.twitter.com/hdr1MYrLr2

— Tibor Blaho (@btibor91) 23, 2025

Addressing concerns about the origin and potential misuse of AI-generated visuals, OpenAI is embedding C2PA (Coalition for Content Provenance and Authenticity) metadata into every image created via the gpt-image-1 API.

C2PA is an open standard that allows creators to attach tamper-evident information about the content’s origin and editing history. Esse padrão de marca d’água digital visa identificar o conteúdo como gerado por IA em plataformas que o suportam. O uso do C2PA do OpenAI começou no início de 2024 com o Dall · E 3, e a empresa reforçou seu compromisso juntando-se ao comitê de C2PA, em maio de 2024 . Comprometido por manipulações simples como corte ou captura de tela, uma limitação reconhecida dentro da indústria e destacada pela pesquisa sobre vulnerabilidades de marcas d’água. confirmou que os prompts e imagens do cliente enviados por meio da API não são usados ​​para treinar seus modelos, abordando uma preocupação importante de privacidade de dados para os desenvolvedores. A empresa mantém sua política contra imitar diretamente os estilos dos artistas vivos. Envolve custos com base no uso do token: US $ 5 por milhão para tokens de texto de entrada, US $ 10 por milhão para tokens de imagem de entrada e US $ 40 por milhão para tokens de imagem de saída. Isso se traduz em aproximadamente 2 a 19 centavos por imagem gerada, dependendo do nível de qualidade escolhido. Algumas organizações podem precisar concluir um processo de verificação de identificação com o OpenAI antes de obter acesso à API.

Embora seja poderoso, o modelo não é instantâneo; Prompts complexos podem levar até dois minutos para processar. Além disso, enquanto a renderização de texto é aprimorada em relação às versões anteriores do Dall-E, a documentação do OpenAI observa possíveis inconsistências na colocação precisa do texto e na manutenção da coerência visual para elementos como caracteres ou logotipos em várias gerações. href=”https://azure.microsoft.com/en-us/blog/unveiling-gpt-image-1–rising-tone-heights-with-image-generation-in-azure-ai-foundry/”Target=”_ Blank”> Microsoft Azure Service , especificamente através do Azure Ai Ai Ai Azry Image Azure Service , especificamente através do Azure. A plataforma do Azure adiciona suas próprias camadas de segurança específicas, como verificações de segurança de conteúdo e monitoramento de abuso no topo das medidas de linha de base do OpenAI. Os desenvolvedores que testam a tecnologia devem observar que o uso do playground de imagem baseado na Web do OpenAI ainda incorre em custos de uso da API. O OpenAI relatou que mais de 130 milhões de usuários de chatgpt geraram mais de 700 milhões de imagens na primeira semana da disponibilidade do recurso, ganhando atenção inicialmente para produzir fotos de estilo ghibli e figuras de ação da IA. Ai. Exemplos citados incluem o figma incorporando as ferramentas em sua plataforma de design e na geração de imagens de teste do Instacart para auxílios visuais em receitas e listas de compras.

Categories: IT Info