O modelo de alfageometria2 do Google Deepmind superou os medalhistas de ouro humano no Olympiad matemático internacional (imo) Problemas apresentados nos últimos 25 anos. O Google expandiu seus recursos para lidar com uma gama mais ampla de problemas de geometria, incluindo aqueles que envolvem movimentos de objetos e equações lineares relacionadas a ângulos, proporções e distâncias.

Em julho passado, o sistema já Encontrou o nível da medalha de prata Ao resolver problemas internacionais da Olimpíada Matemática. Image/gif; base64, r0lgodlhaqabaaaach5baekaaealaaaaabaaaaaaTaeaow==”>

A nova conquista posiciona o sistema de IA como um marco no raciocínio computacional, mostra a capacidade de profundidade.

Seu antecessor, alfagometria, alcançou uma taxa de sucesso de apenas 54%, marcando o novo sistema como um salto substancial para a frente. , que transformou a previsão da estrutura da proteína, e alphago , que dominou o jogo de tabuleiro antigo de Go.

animado por compartilhar detalhes de alfageometria2 (Ag2), parte do sistema que atingiu o padrão de medalha de prata na IMO 2024 em julho passado! AG2 agora superou o medalhista médio de ouro na solução de problemas de geometria da Olimpíada, atingindo uma taxa de solução de 84% para todos os problemas de geometria da IMO… https://t. co/javtpndbmu pic.twitter.com/exhstdevtp

-thang luong (@lmthang) February 7, 2025

The application of AI in competitive mathematics adds to this growing body of work , demonstrando a adaptabilidade dos modelos de DeepMind em abordar uma variedade diversificada de desafios.

alfageometria2 não apenas supera muitos especialistas em humanos, mas também introduz técnicas que podem influenciar a pesquisa e aplicações mais amplas de IA, incluindo campos como engenharia e física.

Seu sucesso está fundamentado em inovações como o conjunto de conhecimento compartilhado de árvores de busca (skest) e motores simbólicos otimizados, que permitem que a IA resolva problemas em velocidades sem precedentes.

No AG1, usamos uma pesquisa simples de feixe para descobrir provas. No AG2, projetamos um novo algoritmo de pesquisa, chamado Ensemble de conhecimento compartilhado de árvores de pesquisa (SKEST), para permitir que várias pesquisas de feixes sejam executadas em paralelo e se ajudem. Essa foi uma das razões pelas quais podemos resolver IMO… pic.twitter.com/z1078g083w

-thang luong (@lmthang) 8 de fevereiro de 2025

all the Hybrid/Strong>

No coração da alfagometria2, fica sua arquitetura híbrida, que combina uma versão finetunada do modelo de linguagem Gemini de DeepMind com um mecanismo de raciocínio simbólico conhecido como DDAR (Raciocínio aritmético do banco de dados dedutivo).

Essa colaboração permite que a IA interprete e formalize problemas complexos de geometria, gera soluções em potencial e valida essas soluções por meio de provas lógicas rigorosas.

De acordo com um publicado recentemente DeepMind Paper sobre alfageometria2 , “Esses aprimoramentos culminam em uma melhoria substancial no desempenho: Ag2 atinge uma taxa impressionante de resolução de 84% em todos os problemas de geometria de 2000 a 2024 IMO, demonstrando um salto significativo na capacidade da IA ​​de combater as tarefas de raciocínio matemático desafiadoras. Isso permite que várias estratégias de solução de problemas funcionem em paralelo. , permitindo explorar vários caminhos de raciocínio simultaneamente. Predecessor, permitindo uma solução de problemas mais abrangente dentro de orçamentos computacionais restritos.

Essas otimizações expandem a gama de problemas que o alfageometria2 pode lidar, incluindo problemas complexos do tipo locus, onde os objetos se movem, mantendo relacionamentos específicos com outros elementos geométricos.

Excedendo o desempenho humano em A geometria

o desempenho do alfageometria2 coloca-o acima do medalhista médio de ouro da IMO, que normalmente resolve 40 dos 50 problemas no conjunto de referência da IMO-AG-50.

O sistema resolveu 42 problemas, marcando uma vantagem leve, mas significativa, sobre especialistas em humanos. Essa conquista é particularmente impressionante, dada a dificuldade dos problemas da IMO, que exigem provas rigorosas para declarações sobre relações geométricas em um plano. Como aqueles que envolvem loci. a> Exige a compreensão de como os pontos ou objetos se movem ao preservar certas condições, uma tarefa que combina raciocínio abstrato com o rigor matemático.

Ao abordar com sucesso esses desafios, a Alpageometria2 expandiu sua cobertura de problemas de 66% para 88% dos problemas de geometria da IMO.://winbuzzher.com/wp-content/uploads/2025/02/ilustration-of-an-example-problem-solved-by-alfageometria-2-vi-google.jpg”> ilustração do”Problema 4″do último A competição do ano, que pede para provar a soma de Kil e quina equivale a 180 °. , criando muitos pares de triângulos semelhantes, como Abe ~ ybi e Ale ~ IPC, para provar a conclusão. muito antes de os computadores estarem obtendo notas completas na IMO.”* ( Nature ). Tais avanços sugerem que sistemas de IA como o alfageometria2 não estão apenas correspondendo ao desempenho humano, mas potencialmente redefinindo o que é possível na solução matemática de problemas. é sua dependência de dados de treinamento sintético. O DeepMind gerou mais de 300 milhões de teoremas e provas sintéticos, cobrindo uma ampla gama de complexidade, para treinar o modelo de linguagem baseado em Gêmeos.

Essa abordagem permitiu à IA desenvolver um profundo entendimento dos princípios geométricos e resolver problemas que se estendem além dos conjuntos de dados com curados humanos. Esses conjuntos de dados sintéticos não apenas aprimoram os recursos de solução de problemas, mas também demonstram a escalabilidade da pesquisa de IA da DeepMind. Ao verificar a consistência lógica das sugestões do modelo de idioma, o DDAR garante que cada etapa no processo de solução de problemas adie a regras matemáticas rigorosas.

Essa combinação de adaptabilidade neural e precisão lógica diferencia o alfageometria2 dos modelos de idiomas grandes mais tradicionais.

Apesar de seu desempenho notável, o sistema tem limitações. Ele luta com problemas que envolvem desigualdades, equações não lineares e contagens de pontos variáveis-áreas que exigem recursos de raciocínio ainda mais avançados. De acordo com a pesquisa de DeepMind, “até que a velocidade do modelo seja aprimorada e as alucinações sejam completamente resolvidas, ferramentas como motores simbólicos permanecerão essenciais para aplicações de matemática.”

implicações além da matemática competitiva

o sucesso da alfageometria2 mostra o potencial dos sistemas híbridos de IA na solução de problemas altamente especializados. A física, onde modelos complexos geralmente dependem de cálculos geométricos complexos. P> Avanços mais amplos da AI do DeepMind fornecem contexto valioso para entender o significado do alfagelimes2. Alphago demonstrou o potencial da IA ​​para dominar o raciocínio estratégico, enquanto grandes modelos de idiomas como a Gêmeos introduziram maneiras inovadoras de enfrentar problemas abstratos.

Perspectivas e desafios futuros

O desenvolvimento de alfageometria2 reacendeu debates na comunidade de pesquisa da IA ​​sobre o papel dos sistemas híbridos na solução de problemas complexos. Enquanto modelos de idiomas grandes como os modelos GPT de Gêmeos ou Openai se destacam na geração de texto semelhante ao humano, eles geralmente vacilam quando confrontados com tarefas que exigem raciocínio formal ou consistência lógica.

alfageometria2 preenche essa lacuna integrando o raciocínio simbólico, oferecendo um plano potencial para a próxima geração de sistemas de IA.

No entanto, os desafios permanecem. A confiança nos motores simbólicos introduz a sobrecarga computacional e a incapacidade do sistema de lidar com certos tipos de problemas destaca a necessidade de mais inovação. À medida que os pesquisadores refinam o modelo, integrar métodos avançados de raciocínio e algoritmos mais rápidos será essencial para superar essas limitações. 3, demonstre a dedicação da empresa em expandir os limites do que a IA pode alcançar.

Categories: IT Info