AI Lab Kinez Deepseek ka lëshuar Deepseek-Prover-V2-671B, një model jashtëzakonisht i madh i gjuhës që synon të provojë teoremën matematikore, duke e bërë atë të disponueshëm në

Ky fokus i efikasitetit u theksua më parë kur Deepseek Opened Infrastrukture Mjetet si Flashmla Vëmendje Kernel dhe 3FS Disponuar System në prill 2024 Trajnuar në një grup të konsiderueshëm të vitit 2048 NVIDIA H800 GPU, sipas .

DeepSeek-Prover-V2-671B nuk është një chatbot i përgjithshëm, por një sistem shumë i specializuar që synon teoremën zyrtare që dëshmon, duke përdorur posaçërisht Gjuha ndihmëse e provave . Lean 4 është një mjet interaktiv i përdorur për të zyrtarizuar përkufizimet dhe provat matematikore dhe për të kontrolluar korrektësinë e tyre në mënyrë llogaritëse. Deepseek-Prover-V2 bashkëvepron me këtë kornizë, me gjasë gjenerimin ose sugjerimin e hapave të provës në sintaksën Lean 4, të cilat më pas kontrollohen nga vetë mjedisi Lean 4 për të siguruar qëndrueshmëri logjike. Kjo sinergji synon ta bëjë detyrën komplekse të verifikimit zyrtar më të menaxhueshëm. Sidoqoftë, arkitektura e saj e përzierjes së ekspertëve (MOE)-një hyrje e kursit të projektimit në vetëm një nënbashkësi të parametrave-nënkupton vetëm një fraksion janë aktivë gjatë konkluzionit, shkallës së balancimit me kosto llogaritëse. This builds on DeepSeek’s prior work, including the 7B parameter DeepSeek-Prover-V1.5 (detailed August 2024), which used techniques like Reinforcement Learning from Proof Assistant Feedback (RLPAF) for Lean 4, itself an evolution from their initial punë prover (maj 2024). 

Kjo qasje ndryshon nga sistemet e tjera të fundit të Matematikës së Profilit të Lartë. Alfageometry2 i Google Deepmind2, i cili kohët e fundit tejkaloi medalje të artë njerëzor në Olimpiadën Matematike Ndërkombëtare Matematik (IMO) Problemet e Gjeometrisë, përdor një arkitekturë hibride duke kombinuar një model të gjuhës Binjakët të rregulluar mirë me një motor të dedikuar simbolik të arsyetimit (DDAR).

Alfageometry2 gjithashtu mbështetej shumë në gjenerimin e sasive të mëdha të të dhënave të trajnimit sintetik (mbi 300 milion teorema dhe prova) për të arritur performancën e tij në problemet e gjeometrisë së stilit të konkurrencës. Modelet e mëparshme të Proverit të Deepseek ( v1.5 dhe në pronësi të shtetit Mobile

Komiteti gjithashtu pretendoi se Deepseek fitoi”dhjetëra mijëra”patate të skuqura të përparuara, duke shkelur potencialisht ligjet e eksportit në SHBA, dhe