OpeniAI na quarta-feira o acesso expandido à sua mais recente tecnologia de geração de imagens, tornando o modelo conhecido como”GPT-Image-1″disponível por meio de sua interface de programação de aplicativos (API). A API fornece recursos para produzir visuais fotorrealistas, alavancar o conhecimento mundial, seguir diretrizes personalizadas, controlar estilos, renderizar o texto dentro das imagens e executar ajustes interativos. entradas e transformá-las. 1535 × 1024 (paisagem). As opções de saída incluem formatos jpeg ou webp, juntamente com o suporte à transparência. nativamente multimodal… ele entende texto e imagens na sequência arbitrária.”
Isso permite tarefas de edição complexas, como modificar as imagens existentes com base na imagem original e em um novo texto de texto, ou usar técnicas de”mascaramento”, para alterar as regiões específicas, deixando outras pessoas que são utilizadas-apresenta um controle criativo. available via the Images API (with support in the Responses API coming soon), allowing developers and businesses to easily integrate high-quality image creation into apps and tools, with usage priced per token… pic.twitter.com/hdr1MYrLr2
— Tibor Blaho (@btibor91) 23, 2025
Addressing concerns about the origin and potential misuse of AI-generated visuals, OpenAI is embedding C2PA (Coalition for Content Provenance and Authenticity) metadata into every image created via the gpt-image-1 API. C2PA is an open standard that allows creators to attach tamper-evident information about the content’s origin and editing history. Esse padrão de marca d’água digital visa identificar o conteúdo como gerado por IA em plataformas que o suportam. O uso do C2PA do OpenAI começou no início de 2024 com o Dall · E 3, e a empresa reforçou seu compromisso juntando-se ao comitê de C2PA, em maio de 2024 . Comprometido por manipulações simples como corte ou captura de tela, uma limitação reconhecida dentro da indústria e destacada pela pesquisa sobre vulnerabilidades de marcas d’água. confirmou que os prompts e imagens do cliente enviados por meio da API não são usados para treinar seus modelos, abordando uma preocupação importante de privacidade de dados para os desenvolvedores. A empresa mantém sua política contra imitar diretamente os estilos dos artistas vivos. Envolve custos com base no uso do token: US $ 5 por milhão para tokens de texto de entrada, US $ 10 por milhão para tokens de imagem de entrada e US $ 40 por milhão para tokens de imagem de saída. Isso se traduz em aproximadamente 2 a 19 centavos por imagem gerada, dependendo do nível de qualidade escolhido. Algumas organizações podem precisar concluir um processo de verificação de identificação com o OpenAI antes de obter acesso à API. Embora seja poderoso, o modelo não é instantâneo; Prompts complexos podem levar até dois minutos para processar. Além disso, enquanto a renderização de texto é aprimorada em relação às versões anteriores do Dall-E, a documentação do OpenAI observa possíveis inconsistências na colocação precisa do texto e na manutenção da coerência visual para elementos como caracteres ou logotipos em várias gerações. href=”https://azure.microsoft.com/en-us/blog/unveiling-gpt-image-1–rising-tone-heights-with-image-generation-in-azure-ai-foundry/”Target=”_ Blank”> Microsoft Azure Service