Chinese AI lab DeepSeek has released DeepSeek-Prover-V2-671B, an exceptionally large language model aimed at mathematical theorem proving, making it available on Hugging Face. The release continues the company’s pattern of open-sourcing powerful models even as it navigates intense geopolitical scrutiny, particularly from the United States, and adapts to tightening US export controls on advanced computing hardware that have been in place since late 2022.
DeepSeek-Prover-V2-671B appears ahead of the soon expected release of its next reasoning model DeepSeek R2, which the company is pushing for an O anterioară planificată, în timp ce combate întărirea reglementărilor din SUA și europene și intensificarea concurenței de la OpenAI, Google, Antropic, Xai și Alibaba.
eficiență sub constrângeri
aceste restricții de hardware, limitând accesul la GPU-uri de top, care se ridică la un nivel de hardware, care se ridică la un nivel de top, precum GPU-uri, care se ridică la un nivel de hardware, care se limitează la FOLDSEEK GPUS, care se potrivesc cu un nivel înalt de hardware, care se limitează la FOLDSEEK GPUS, care se află în centrul de top. pe eficiență de calcul. Compania a încorporat tehnici precum atenția latentă cu mai multe cap (MLA)-o abordare concepută pentru gestionarea eficientă a secvențelor de date lungi (până la 128.000 de jetoane în modelul său de bază V3)-și cuantificarea FP8, un format numeric cu precizie scăzută care reduce nevoile de memorie, în arhitectura modelului său. src=”https://winbuzzer.com/wp-content/uploads/2025/01/deepseek.jpg”>
Acest accent de eficiență a fost evidențiat anterior atunci când Instrumentele de infrastructură de la Deepseek, precum FlashMLA Atenție și Sistemul de fișiere Distribuit 3FS în 2024. Un cluster substanțial de 2048 NVIDIA H800 GPUS, conform Raport tehnic .
AI abordează matematica formală
profundseek-prover-v2-621 Un chatbot general, dar un sistem extrem de specializat care vizează o teoremă formală care se dovedește, în special folosind Lean 4 dovadă limbaj . Lean 4 este un instrument interactiv utilizat pentru formalizarea definițiilor și dovezile matematice și pentru a-și verifica corectitudinea din punct de vedere al calculului.
Este un puternic asistent de dovadă și un limbaj de programare care oferă cadrul pentru exprimarea argumentelor matematice în mod formal și verificând corectitudinea lor. Deepseek-Prover-V2 interacționează cu acest cadru, probabil generarea sau sugerează pași de dovadă în sintaxa Lean 4, care sunt apoi verificate de mediul Lean 4 în sine pentru a asigura soliditatea logică. Această sinergie își propune să facă sarcina complexă a verificării formale mai ușor de gestionat.
Modelul folosește un masiv de 671 miliarde de parametri totali, distribuiți în securitatea Safetensors Format. Cu toate acestea, arhitectura sa de amestec de experți (MOE)-o intrare de rutare a proiectării la doar un subset de parametri-înseamnă că doar o fracție sunt active în timpul inferenței, echilibrarea scării cu costurile de calcul.
aplicațiile potențiale includ generarea automată a generarii pas-by-pas. Aceasta se bazează pe lucrările anterioare ale Deepseek, inclusiv parametrul 7b Deepseek-Prover-V1.5 (detaliat 2024 august), care au folosit tehnici, cum ar fi învățarea de consolidare de la feedback-ul lor de asistență de probă (RLPAF), care a utilizat 4, în sine învățarea de la Inițial Inițial
Această abordare diferă de alte sisteme AI de matematică cu profil recent. Alphageometry2 de la Google Deepmind, care a depășit recent medaliștii de aur uman la problemele de geometrie internaționale olimpiade matematice (IMO), folosește o arhitectură hibridă care combină un model de limbaj gemini reglat fin, cu un motor de raționament simbolic dedicat (DDAR).
Alphageometry2 s-a bazat, de asemenea, foarte mult pe generarea de cantități mari de date de antrenament sintetice (peste 300 de milioane de teoreme și dovezi) pentru a-și atinge performanța în problemele de geometrie în stil concurenței. Modelele prover anterioare ale Deepseek ( v1.5 și China de stat și mobilă, de stat, de stat, și de integrare a potențialului, a atenuării, a bydedance, de stat, de stat, de stat, de stat, de stat, de stat, de stat, de stat, de stat, de stat, de stat, de stat, de stat, de stat, de stat, de stat, de stat, de stat, de stat citând cercetări de la firma de securitate cibernetică Feroot Security.
Comitetul a presupus, de asemenea, Deepseek a dobândit „zeci de mii” de cipuri avansate, care ar putea încălca legile exporturilor americane și Microsoft Security Researchers Sugesting DeepSeek. Tehnici utilizate în mod necorespunzător, cum ar fi distilarea modelului, prin eludarea garanțiilor pe modelele americane.
versiunile continue ale surselor deschise ale DeepSeek, inclusiv Prover V2, și concurența sa cu rivalii interni precum Alibaba (care a lansat