O OpenAI reverteu sua decisão de fevereiro de cancelar o modelo O3, anunciando que ele lançará O3 e O4-mini nas próximas semanas-comprando o GPT-5 em espera até o final deste ano. A atualização foi confirmada pelo CEO Sam Altman em um post em X, onde ele disse que a empresa agora manterá os modelos focados em raciocínio separados de seus modelos de linguagem de uso geral. Modelos de bate-papo/conclusão.”Altman escreveu. Ele acrescentou:”Estamos empolgados com o desempenho que estamos vendo da O3 internamente”. src=”https://winbuzzer.com/wp-content/uploads/2023/08/openai-logo.jpg”>
Há várias razões para isso, mas o mais emocionante é que será capaz de tornar o GPT-5 muito melhor que nós, originalmente…
-Sam. href=”https://twitter.com/sama/status/1908167621624856998?ref_src=twsrc%5etfw”Target=”_”Blank”> 4 de abril, 2025
the reversal diretamente no GPT-5. Essa estratégia teve como objetivo reduzir a confusão do usuário e simplificar a complexidade do produto. O Openai havia dito que queria criar um único sistema que pudesse servir a todas as funções sem exigir um “seletor de modelos”. Configurações de baixa eficiência e 91,5% no modo de alta eficiência. Na referência de matemática do AIME 2024, atingiu 96,7%. Também teve um bom desempenho no GPQA Diamond, um teste para o raciocínio científico em nível de doutorado, com uma pontuação de 87,7%. Esses números colocam O3 acima do GPT-4.5 e O3-mini em tarefas técnicas específicas, especialmente em domínios estruturados. Isso permite resolver problemas complexos de várias etapas de maneira mais eficaz do que os modelos anteriores. A O3 permite que os desenvolvedores aumentem a profundidade do raciocínio, mas a troca é o uso acentuado de computação-até 172x a mais em configurações de alta eficiência. Essas demandas foram confirmadas no blog de referência do ARC e levantam questões sobre viabilidade em escala. Com base nas convenções de nomenclatura da OpenAI, provavelmente oferece requisitos de computação reduzidos com muitos dos mesmos benefícios de raciocínio. A empresa ainda não compartilhou referências ou especificações públicas. Em 20 de março, a empresa lançou o O1-Pro via acesso da API, direcionando casos de uso corporativo, como Tech Legal Tech e Agent Pipelines. O modelo suporta até 100.000 tokens de saída e requer US $ 5 em gastos anteriores para desbloquear o acesso. Os preços começam em US $ 150 por milhão de tokens de entrada e US $ 600 para saídas. Custo, conforme relatado em 7 de março. Isso mostra uma divergência nos modelos de negócios: a Microsoft agrupa as ferramentas de raciocínio do OpenAI em software mais amplo, enquanto o OpenAI monetiza o raciocínio como um recurso premium. Altman diz que o modelo chegará”em alguns meses”, embora nenhuma data específica tenha sido dada. Quando é lançado, o GPT-5 deve integrar raciocínio e geração em um sistema. Esse objetivo havia sido citado originalmente no plano agora em fevereiro agora de fevereiro para dobrar a O3 no GPT-5. Lançado no final de fevereiro, o GPT-4.5 expandiu a janela de contexto do sistema para 200.000 tokens e introduziu melhorias no entendimento multilíngue. No entanto, ele ainda tem um desempenho abaixo dos benchmarks de raciocínio de matemática e ciências em comparação com o O3-mini. O OpenAI admitiu que modelos como O3-mini ainda superam o GPT-4.5 em domínios de alto rigor, como codificação e solução avançada de problemas. A mudança de roteiro está se desenrolando ao lado de movimentos financeiros e de infraestrutura substanciais. Em 1º de abril, a empresa anunciou um acordo de concurso de US $ 40 bilhões liderado pelo Softbank, elevando sua avaliação para US $ 300 bilhões. A estrutura do acordo-vendas secundárias de ações secundárias-permitiu que os primeiros funcionários e investidores sacarem enquanto aumentam a pressão sobre o OpenAI para enviar produtos de alto valor. Em março, assinou um contrato de computação de US $ 11,9 bilhões com a CoreWeave e recebeu uma participação acionária de US $ 350 milhões na empresa. Ele também continua o desenvolvimento de chips de IA personalizados em parceria com a Broadcom e o TSMC, com os projetos iniciais esperados ainda este ano.
Modelo de peso aberto e transparência Push
Pouco antes da reversão da O3, Altman também anunciou que o OpenAI está preparando o lançamento de seu primeiro modelo de linguagem de peso aberto desde o GPT-2. Ele descreveu o modelo como”bastante capaz”e pediu aos desenvolvedores e pesquisadores que fornecessem feedback sobre como melhorar sua utilidade. A empresa esclareceu que o modelo incluirá pesos pré-treinados, mas não treinando dados ou código. Altman escreveu. A medida ocorre em meio à crescente demanda de transparência e à concorrência de modelos de código aberto liberados por Meta, Mistral e Deepseek.
OpenAI também fez alterações para aumentar a interpretabilidade. Em fevereiro, a empresa começou a revelar traços internos de raciocínio da O3-Mini, ajudando desenvolvedores e pesquisadores a entender como os modelos chegam às respostas. Essa decisão reflete uma mudança mais ampla em direção à explicação em toda a família de modelos de raciocínio da empresa. Em vez de esperar os recursos de agrupar um modelo de fronteira abrangente, o OpenAI agora está lançando ferramentas especializadas à medida que se tornam prontas para a produção.
A mudança vem com trade-offs. Os usuários agora enfrentam mais tipos de modelos, mas cada um é melhor otimizado para tarefas específicas. As empresas podem adotar modelos de raciocínio sofisticados como O1-Pro, enquanto os desenvolvedores obtêm acesso a sistemas intermediários como O4-mini-ou a versões de peso aberto para experimentação mais transparente. Se o GPT-5 acabará consolidando essas ofertas-ou será apenas mais uma filial na árvore modelo em expansão da empresa-permanece a ser vista.