A corrida pela supremacia de IA atingiu um novo pico, já que o Google DeepMind e o Openai agora afirmam que seus modelos podem conquistar a Olimpíada Matemática Internacional (IMO), um dos desafios intelectuais mais difíceis da humanidade. href=”https://deepmind.google/discover/blog/advanced-version-of-gimini-with-deep-think-officialmente-achieves-gold-medal-standard-at-the-international-mathematical-olympiad/”Target=”_”> Goldials. As notícias chegaram a poucos dias depois que o Rival Openai revelou que seu próprio modelo havia alcançado não oficialmente a mesma pontuação de primeira linha.
Esse avanço sinaliza um salto dramático no raciocínio da IA. Isso prova que os modelos de uso geral agora podem resolver problemas matemáticos complexos em nível humano de elite, escalando a rivalidade entre os dois líderes da IA. Twist
O modelo avançado de gêmeos do Google Deepmind, aprimorado com a tecnologia”Deep Think”, resolveu cinco dos seis problemas excepcionalmente difíceis. Ganhou 35 de 42 pontos possíveis, uma pontuação bem dentro do O Gold Medal Lhester para este ano de um ano . Coordenadores. O presidente da IMO, Dr. Gregor Dolinar, confirmou a conquista, afirmando: “Podemos confirmar que o Google Deepmind alcançou o marco muito desejado, ganhando 35 de 42 pontos possíveis-uma pontuação de medalha de ouro. Suas soluções ficaram surpreendentes em muitos aspectos”. No entanto, a declaração oficial da IMO esclareceu apenas Validou as soluções, não o sistema ai ai, Seja uma resposta direta ao OpenAI. Apenas dois dias antes, o Openai anunciou preventivamente seu próprio modelo experimental também marcou 35 pontos nos mesmos problemas, um movimento que chamou a atenção dos observadores da indústria. Em 2024, seus sistemas atingiram um padrão de medalha de prata, mas Revencimento humano significativo e as ferramentas especiais e as ferramentas especializadas . em linguagem natural. Processou as descrições oficiais de problemas e gerou diretamente provas matemáticas rigorosas, tudo dentro do prazo estrito de 4,5 horas de competição. Ele mostra uma forma mais flexível e poderosa de raciocínio de IA. O pesquisador do Openai Noam Brown enfatizou:”Este não é um modelo específico da IMO. É um LLM de raciocínio que incorpora novas técnicas experimentais de uso geral”, um sentimento ecoado por seus colegas. Isso sugere que os modelos subjacentes são amplamente capazes, não apenas especialistas em matemática estreitos. Esse modo incorpora o pensamento paralelo, permitindo que o modelo explore e combine vários caminhos potenciais de solução de uma só vez, em vez de buscar uma única cadeia linear de pensamento. Para o OpenAI, alcançar o que o CEO Sam Altman chamou de”sonho”,”quando começamos o Openai, este foi um sonho, mas não um que parecia muito realista para nós”, serve como uma refutação poderosa para as narrativas de uma empresa perdendo sua vantagem. O pesquisador do OpenAI Alexander Wei observou que a conquista representa um”grande desafio de longa data na IA”, acrescentando que”estou animado em compartilhar que nosso mais recente @openai experimental raciocínio LLM alcançou um grande desafio de longa data em AI: ACEDIMENTO DO GOLD ANTERMULTER ADENDIMENTO PRONTAGEM DO SIGNIMENTO DO PESTIOM DO GOLMEN, PERSIMENTO PARTILHOMEIRA (Ambas as empresas de Medalha de Golds Antes de Signal Luster, que é mais uma concorrência de matemática em Potests. DeepMind, expressou confiança sobre os próximos passos, dizendo:”Estamos muito confiantes de que podemos trazer [o modelo] para as mãos de nossos testadores confiáveis muito em breve, especialmente os matemáticos”. O objetivo é colocar essas ferramentas nas mãos dos matemáticos para ajudá-los a resolver problemas ainda mais difíceis.
Enquanto o foco imediato está na matemática, as implicações são muito mais amplas. Uma IA que pode raciocinar com esse nível de criatividade e rigor pode acelerar descobertas em ciências, engenharia e pesquisa, aproximando-nos um passo mais perto do objetivo final da AGI.