O OpenAI atualizou seu modelo GPT-4O, melhorando sua capacidade de lidar com consultas relacionadas a STEM, interpretar dados visuais e incorporar conhecimentos mais recentes em suas respostas.
A atualização mais recente estende os dados de treinamento do modelo de novembro de 2023 a junho de 2024, permitindo processar uma ampla gama de tópicos atuais com maior precisão. Juntamente com esses avanços técnicos, o OpenAI ajustou o estilo de conversação do modelo, aumentando o uso de emojis em interações casuais. Riscos no desenvolvimento rápido da IA
Open diz que GPT diz que GPT-4o agora demonstra desempenho mais forte em benchmarks multimodais de AI, como Mathvista e MMMU, que testam a capacidade de um modelo de entender e analisar o texto e as imagens.
De acordo com o OpenAI, o modelo refinado fornece”idéias mais ricas e orientação mais precisa”ao avaliar o conteúdo visual, tornando-o mais eficaz para usuários que trabalham com diagramas complexos, esquemas técnicos e visualizações de dados.
As melhorias também aprimoram a confiabilidade do GPT-4O nos campos STEM, uma área onde os modelos de IA enfrentaram historicamente desafios, particularmente com a solução complexa de problemas. Melhor raciocínio conceitual e proficiência técnica. Para resultados da Web. e codificação. A atualização aprimora a capacidade do modelo de processar cálculos lógicos e numéricos estruturados, áreas onde as iterações anteriores ocasionalmente produziram resultados incorretos.
O OpenAI enfatizou essas melhorias em seu anúncio, afirmando: “O GPT-4O agora é melhor em problemas de matemática, ciências e codificação, com ganhos em vasos acadêmicos como GPQA e matemática. Sua pontuação aprimorada no MMLU-uma referência abrangente da compreensão da linguagem, amplitude do conhecimento e raciocínio-reflete sua capacidade de enfrentar problemas mais complexos entre os domínios.”
Essas atualizações beneficiam desenvolvedores, pesquisadores e estudantes que dependem Solução de problemas assistida por A, particularmente em áreas que exigem precisão, como cálculo avançado, algoritmos de aprendizado de máquina e simulações científicas. são centrais para campos como desenvolvimento de software e física teórica/p>
Embora o OpenAI não tenha declarado explicitamente se o GPT-4O incorpora novos avanços no raciocínio estruturado, o desempenho aprimorado do modelo em GPQA e MMLU sugere refinamentos na maneira como processa tarefas lógicas de várias etapas.
Análise de imagem mais precisa e entendimento multimodal
A atualização também aprimora a capacidade do GPT-4O de processar imagens, tornando-a uma ferramenta mais capaz para analisar relações espaciais, interpretar diagramas técnicos e fornecer Insights com reconhecimento de contexto com base na entrada visual.
Openi relatou que o GPT-4O agora ocupa o maior número de referências de avaliação multimodal, como Mathvista e MMMU, indicando um desempenho mais forte na integração de raciocínio visual e baseado em texto. Observando que “o modelo atualizado é mais hábil na interpretação de relações espaciais nos uploads de imagens, além de analisar diagramas complexos, entender gráficos e gráficos e conectar a entrada visual com conteúdo escrito.”
A capacidade de contextualizar e contextualizar e Analisar dados visuais com mais eficiência torna o GPT-4O útil para aplicações em engenharia, arquitetura e ciência de dados, onde os modelos de IA devem processar e interpretar diagramas ou esquemas com alta precisão.
Para usuários que trabalham com desenhos técnicos detalhados, Blueprints, ou gráficos matemáticos, essas melhorias significam que o ChatGPT agora pode oferecer informações mais detalhadas sobre layouts espaciais e relacionamentos numéricos dentro de dados visuais. de imagens, como pesquisa científica, mapeamento geoespacial e imagem médica. O estilo de conversação do GPT-4O, incorporando mais uso de emoji nas respostas. A empresa afirmou que o modelo agora incluirá dinamicamente emojis nas interações, principalmente quando os usuários já os usam em suas mensagens.
OpenAI reconheceu o ajuste em seu anúncio, explicando: “O GPT-4O agora está um pouco mais entusiasmado em seu uso de emoji (talvez particularmente se você usar emoji na conversa )-deixe-nos saber o que você Pense.”
A empresa incentivou os usuários a fornecer feedback sobre se o aumento do uso de emojis melhora a experiência do usuário ou deve ser ajustado em atualizações futuras.
Enquanto a mudança relacionada a emoji Não afeta os recursos de raciocínio do modelo, ele sinaliza uma tendência mais ampla para tornar as interações de IA mais naturais e humanas. Opções de personalização para tom de conversação em iterações futuras. Um momento em que o OpenAI enfrenta a crescente concorrência dos desenvolvedores rivais da IA, principalmente nas áreas de eficiência e desempenho do raciocínio.
A Deepseek, uma empresa de IA com sede na China, introduziu recentemente seu modelo R1, que demonstrou fortes resultados em benchmarks de raciocínio enquanto operava em uma fração dos recursos computacionais usados pelos modelos da OpenAI.
A abordagem orientada por eficiência da Deepseek levou as respostas dos líderes do setor, incluindo o CEO da Openai, Sam Altman, que reconheceu a concorrência afirmando: “Obviamente, entregaremos modelos muito melhores e também puxaremos alguns lançamentos.”
Relacionado: AUDIT AUDIT-Deepseek falha 83% dos testes de precisão devido a desinformação e censura
Além de refinar o GPT-4O com a atualização mais recente, o OpenAI é Preparando-se para iniciar o O3-Mini, um modelo focado em raciocínio otimizado para velocidade e eficiência Além disso, o OpenAI está expandindo seu alcance para o setor público com o GOV do ChatGPT, uma versão de seu modelo projetado para uso pelas agências federais dos EUA. 5 (IL5) Padrões de segurança, garantindo a conformidade com os regulamentos federais.
O modelo está atualmente passando pelo processo de acreditação da FedRamp, um requisito essencial para provedores de nuvem que trabalham com agências governamentais dos EUA. GOV em fluxos de trabalho do setor público, afirmando: “Vemos um enorme potencial para essas ferramentas apoiar o setor público no combate aos desafios complexos”. Os primeiros programas piloto demonstrando ganhos mensuráveis de produtividade. > Com a próxima onda de avanços de IA no horizonte, é provável que o OpenAI se concentre em escalar seus modelos, garantindo a confiabilidade em aplicativos do mundo real. mercado com diferentes estratégias de otimização.