Chinese Ai Lab DeepSeek har gitt ut DeepSeek-Prover-V2-671B, en usedvanlig stor språkmodell rettet mot matematisk teorem som beviser, noe Utgivelsen fortsetter selskapets mønster av åpenhjerting av kraftige modeller, selv om den navigerer i intens geopolitisk kontroll, spesielt fra USA, og tilpasser seg å stramme amerikanske eksportkontroller på avansert databehandlingsmaskinvare som har vært på plass siden slutten av 2022. DeepSeek-prever-v2 dyp-671b som viste seg som en PENS-utgivelse av den som ikke er en Tidligere enn planlagt utrulling når den kjemper mot å stramme amerikanske og europeiske forskrifter og intensivere konkurransen fra Openai, Google, Anthropic, Xai og Alibaba.

effektiviteten under begrensninger

disse maskinvarebegrensningene, som ser til Top-tier nvidia grops focus på Beregningseffektivitet. Selskapet inkorporerte teknikker som flerhode latent oppmerksomhet (MLA)-en tilnærming designet for effektiv håndtering av lange datasekvenser (opptil 128 000 symboler i sin V3-basemodell)-og FP8-kvantisering, et numerisk format med lavt presisjon som reduserer hukommelsesbehov, i modellarkitekturen. src=”https://winbuzzer.com/wp-content/uploads/2025/01/deepseek.jpg”>

Dette effektivitetsfokuset ble tidligere uthevet når deepseek open-sour foundation infrastructure-filen som den vilje. V2, ble trent på en betydelig klynge av 2048 NVIDIA H800 GPUS, ifølge dens teknisk rapport

_ blank”> teknisk rapport .

DeepSeek-Prover-V2-671B er ikke en generell chatbot, men et høyt spesialisert system som er målrettet mot formell teorem som beviser, spesielt ved hjelp av lean 4 Proofs. Lean 4 er et interaktivt verktøy som brukes til å formalisere matematiske definisjoner og bevis og sjekke deres korrekthet beregningsmessig.

Det er et kraftig bevis assistent og programmeringsspråk som gir rammeverket for å uttrykke matematiske argumenter formelt og beregningsmessig verifisere deres korrekthet. DeepSeek-Prover-V2 samhandler med denne rammen, og sannsynligvis genererer eller antyder bevisstrinn i Lean 4-syntaks, som deretter blir sjekket av selve Lean 4-miljøet for å sikre logisk sunnhet. Denne synergien tar sikte på å gjøre den komplekse oppgaven med formell verifisering mer håndterbar.

Modellen bruker en massiv 671 milliarder totale parametere, distribuert i den sikre safetensors

Potensielle applikasjoner inkluderer automatisk generering av trinn-by-steg-bevis. Dette bygger på DeepSeek sitt tidligere arbeid, inkludert 7B-parameteren DeepSeek-Prover-v1.5 (detaljert august 2024), som brukte teknikker som Feed for Learce Learning Learning Antray Back TECH-en som brukes på en ære-ve. Prover Work (Mai 2024). 

Denne tilnærmingen skiller seg fra andre nylige høyprofilerte matematikk-AI-systemer. Google DeepMinds AlphageOmetry2, som nylig overgikk menneskelige gullmedaljevinner på internasjonal matematisk olympiad (IMO) geometri-problemer, bruker en hybridarkitektur som kombinerer en finjustert Gemini-språkmodell med en dedikert symbolsk resonnementmotor (DDAR).

AlphageOmetry2 stolte også sterkt på å generere enorme mengder syntetiske treningsdata (over 300 millioner teorier og bevis) for å oppnå ytelsen på konkurransestil geometri-problemer. DeepSeek’s tidligere Prover-modeller ( v1.5 og state-owned China Mobile and potentially integrates tracking tools from ByteDance and Tencent, med henvisning til forskning fra cybersecurity-firmaet Feroot Security. 

The committee also alleged DeepSeek acquired “tens of thousands”of advanced chips, potentially violating US export laws, and requested NVIDIA avslører salgsinformasjon Til visse asiatiske nasjoner for å spore sluttbrukere. Videre fremhevet rapporten immaterielle problemer med immaterielle eiendommer, med henvisning til vitnesbyrd fra Openai og funn fra