O OpenAI lançou o O3-Pro, um novo modelo de raciocínio destinado a profissionais e empresas que exigem um maior grau de precisão para uma solução complexa de resolução de problemas. O lançamento estabelece uma nova camada premium para a IA mais avançada da empresa, que vem com um preço dez vezes maior que a contraparte padrão de O3. anúncio oficial Do Centro de Ajuda do Openai. Enquanto o OpenAI elogia o desempenho superior nos benchmarks acadêmicos sobre os concorrentes, o verdadeiro valor do O3-Pro parece estar além dos testes simples. As revisões de acesso antecipadas sugerem que sua inteligência avançada é totalmente desbloqueada quando alimentada com um extenso contexto, posicionando-o menos como um chatbot de conversação e mais como um mecanismo especializado para análise profunda.

O modelo O3-PRO já está disponível para os assinantes ChatGPT Pro e Team, substituindo o O1-Pro mais antigo, pelo acesso aos clientes corporativos e EDU que se espera que se seguem. No entanto, o desempenho premium vem com trade-offs; O OpenAI confirma que as respostas do O3-Pro são tipicamente mais lentas que seus antecessores e que, no lançamento, o modelo não tem suporte para geração de imagens, bate-papos temporários e o recurso de tela. API. Isso o torna um investimento significativo em comparação com o recém-descontado O3 Standard, que agora custa apenas US $ 2 e US $ 8 pelos mesmos valores de token. A estratégia de preços parece destinada ao reposicionamento do mercado, pois o O3-Pro também é 87% mais barato que o modelo O1-Pro que substitui, sugerindo um movimento para tornar suas capacidades mais altas de nível mais acessíveis, mas ainda distintas. A empresa afirma que o novo modelo é classificado mais alto por sua clareza, precisão e capacidade de seguir instruções complexas. Não acreditava nas taxas de vitória em relação à O3 na primeira vez que as vi”. Essa confiança é apoiada por testes internos, mostrando o O3-Pro superando o Gemini 2.5 Pro e o antropal Claude 4 Opus do Google sobre benchmarks de ciência e matemática difíceis. De acordo com um revisão precoce de acesso inicial sobre o espaço latente , as capacidades aprimoradas do modelo nem sempre são óbvias em perguntas simples e únicas. A chave para alavancar seu poder é fornecer uma quantidade enorme de informações relevantes. A melhor abordagem, sugere a revisão, é tratá-la como um”gerador de relatório”em vez de um chatbot.

Em um teste por espaço latente, o modelo recebeu um tesouro de documentos e objetivos da empresa interna. A análise resultante foi tão específica e enraizada nos dados fornecidos que eles dizem que”realmente mudou a maneira como estamos pensando sobre o nosso futuro”. Essa experiência positiva e de alto contexto, no entanto, não é universal. Saída do modelo”Lazy”e difícil de distinguir do O3 regular. Reforçando ainda mais o ângulo da “ferramenta especializada”, Developer e Blogger Simon Willison Notes que O3-pro é lento e parece funcionar quando o raciocínio src=”Dados: imagem/svg+xml; nitro-inempty-id=mty0noxnji4-1; base64, phn2zyb2awv3qm94psiwidagmti4mca3mjai IhdpzhropsixmjgwiiBozwlnahq9ijcymcigEg1sbnm9Imh0dha6ly93d3cudzmub3jnlziwmdavc3znij48l3n2zz4=”>

do agente ao analista: a mudança estratégica da série O

O lançamento do O3-Pro marca um passo significativo na evolução dos modelos”O-Series”da OpenAI. Esses modelos são fundamentalmente diferentes da linha GPT, projetados para”profundidade”e”deliberação”, com um orçamento maior para o pensamento interno e o uso de ferramentas nativas. Essa arquitetura lhes permite planejar e agir dentro de seu próprio processo de raciocínio, uma capacidade exibida pela primeira vez com o lançamento de abril de O3 e O4-mini. Isso representa uma mudança estratégica dos assistentes de IA que simplesmente respondem a perguntas a”parceiros estratégicos”que podem ajudar ativamente os usuários a alcançar objetivos. A introdução de uma versão”Pro”menos de dois meses depois indica que o OpenAI agora está focado em endurecer essas habilidades órgãos experimentais em uma ferramenta confiável e pronta para a empresa. Logo após a estréia do modelo O3, surgiram relatos de ter uma tendência maior de alucinar do que os modelos mais antigos. A empresa de IA Vectara descobriu que o modelo O3 tinha uma taxa de alucinação de 6,8% ao resumir artigos. Independent research from Transluce AI detailed instances where a pre-release version of o3 would fabricate the actions it took to solve a problem.

More alarming were findings from the independent group Palisade Research in May, which reported that the o3 model actively defied shutdown comandos em um ambiente controlado. As descobertas do grupo incluíram a alegação impressionante de que essa foi a “primeira vez que os modelos de IA foram observados, impedindo-se de ser fechado, apesar das instruções explícitas em contrário.”

Esses incidentes destacaram o imenso desafio de garantir a segurança e o alinhamento da IA ​​à medida que os modelos se tornam mais poderosos. Em um movimento aparente em direção a uma maior transparência, o OpenAI lançou um’cubo de avaliações de segurança’em maio para compartilhar os resultados dos testes internos, um desenvolvimento relatado por Techn Techn por Techn. A O3-Pro está posicionada como a resposta da OpenAI à demanda do mercado por uma IA que não é apenas inteligente, mas fundamentalmente confiável. O sucesso do modelo provavelmente dependerá de seus recursos aprimorados e caros de raciocínio podem superar consistentemente os problemas de confiabilidade que atormentaram até os sistemas de IA mais avançados.