Ai Tackles Tackles Mathematics
Deepseek-prover-v2-671b não é um chatbot geral, mas um sistema altamente especializado direcionado ao teorema formal que está provando, usando especificamente o 4 4a. O Lean 4 é uma ferramenta interativa usada para formalizar definições e provas matemáticas e verificar sua correção computacionalmente. Deepseek-Prover-V2 interage com essa estrutura, provavelmente gerando ou sugerindo etapas de prova na sintaxe Lean 4, que são verificadas pelo próprio ambiente Lean 4 para garantir a solidez lógica. Essa sinergia visa tornar a complexa tarefa de verificação formal mais gerenciável. No entanto, sua arquitetura de mistura de especialistas (MOE)-uma entrada de roteamento de design para apenas um subconjunto de parâmetros-significa apenas uma fração ativa durante a inferência, balanceamento com custo computacional. This builds on DeepSeek’s prior work, including the 7B parameter DeepSeek-Prover-V1.5 (detailed August 2024), which used techniques like Reinforcement Learning from Proof Assistant Feedback (RLPAF) for Lean 4, itself an evolution from their initial Trabalho de Prover (maio de 2024).
Essa abordagem difere de outros sistemas de IA matemática recentes de alto perfil. O alfageometria 2 do Google DeepMind2, que superou recentemente os medalhistas de ouro humano na geometria da Olimpíada Matemática Internacional (IMO), emprega uma arquitetura híbrida que combina um modelo de linguagem de gêmeos de ajuste fino com um mecanismo de raciocínio simbólico dedicado (DDAR).
alfageometria2 também se baseou fortemente na geração de vastas quantidades de dados de treinamento sintético (mais de 300 milhões de teoremas e provas) para alcançar seu desempenho nos problemas de geometria no estilo de competição. Os modelos de prover anteriores de Deepseek ( v1.5 e
Meanwhile, Microsoft’s rStar-Math framework takes a contrasting path, focusing on enhancing the mathematical reasoning capabilities of small language models (SLMS). Utiliza técnicas como MCTs, raciocínio de cadeia de pensamento (COT) (produzindo um código de preferência de processo (PPM) para avaliar etapas intermediárias, habilitando os modelos de parâmetro de 7 bilhões, enquanto os modelos de parâmetros de 7 bilhões de parâmetros
, enquanto os modelos de parâmetros de 7 bilhões de parâmetros
A alfagometria tem como alvo a geometria da Olimpíada com uma abordagem simbólica/neural híbrida, e o rstar-math otimiza modelos menores para tarefas mais amplas de raciocínio de matemática. ECOSYSTEM. No início de 2025, a Marinha dos EUA proibiu seu uso sobre os riscos de segurança, seguidos em breve pelo Texas proibindo o aplicativo Chatbot em dispositivos do governo estadual. Essa pressão foi significativamente amplificada por um relatório de 16 de abril do Comitê Selecionado da Casa dos EUA no PCC, intitulado”Deepseek desmascarado”. O comitê rotulou a empresa como o risco de segurança nacional.
O presidente do comitê, John Moolenaar, afirmou: “Este relatório deixa claro: o Deepseek não é apenas mais um aplicativo de IA-é uma arma no arsenal do Partido Comunista Chinês, o comitê do Partido, Open, o comitê do Partido Comunista, o que se aproxima, o comitê dos americanos, o comitê do Partido Comunista e subverteu o Strong State-own citando pesquisas da empresa de segurança cibernética Feroot Security.
The committee also alleged DeepSeek acquired “tens of thousands”of advanced chips, potentially violating US export laws, and requested A NVIDIA divulga informações de vendas a certas nações asiáticas para rastrear usuários finais. Além disso, o relatório destacou preocupações da propriedade intelectual, referenciando o testemunho do OpenAI e as descobertas de