A DeepSeek a Massive 671B PROVER V2 modellt, amely a matematikai tételnek bizonyítja az R2 kiadását

Kínai AI Lab A DeepSeek kiadta a DeepSeek-Prover-V2-671b-t, egy rendkívül nagy nyelvi modellt, amely a matematikai tétel bizonyítására irányul, és elérhetővé teszi a “> hunyt”A kiadás folytatja a vállalat nyílt forráskódú hatalmas modelljeinek mintáját, még akkor is, ha az intenzív geopolitikai ellenőrzést navigál, különösen az Egyesült Államoktól, és alkalmazkodik az amerikai exportvezérlők szigorításához a fejlett számítástechnikai hardveren, amely a 2022 vége óta működik. Az Egyesült Államok és az európai előírások szigorításával és az Openai, a Google, az Antropic, az Xai és az Alibaba fokozott versenyének fokozódásával küzdött, amikor harcol. hatékonyság. A vállalat beépített technikákat, például a többfejű látens figyelmet (MLA)-egy olyan megközelítés, amelyet a hosszú adatszekvenciák hatékony kezelésére terveztek (legfeljebb 128 000 token a V3 alapmodellében)-és az FP8 kvantálás, egy alacsony pontosságú numerikus formátum, amely csökkenti a memória igényeit. src=”https://winbuzzer.com/wp-content/uploads/2025/01/deepseek.jpg”>

Ezt a hatékonysági fókuszt korábban kiemelték, amikor a DeepSeek nyitott infrastruktúra eszközöket, mint például a FlashMla Figyelem Kernel és a 3FS elosztott fájlrendszer, a V2-es V2-es V2-es, a V2-es V2. A 2048-as NVIDIA H800 GPU-ból származó jelentős klaszter műszaki jelentés .

A DeepSeek-Prover-V2-671b nem általános chatbot, hanem egy rendkívül speciális rendszer, amely a formális tételeket célozza meg, kifejezetten a Lean 4 bizonyító asszisztens nyelv . A Lean 4 egy interaktív eszköz, amelyet a matematikai definíciók és bizonyítékok formalizálására használnak, és számítási szempontból ellenőrzik helyességüket. A DeepSeek-Prover-V2 kölcsönhatásba lép ezzel a kerettel, valószínűleg a Lean 4 szintaxisban, vagy azt javasolja, vagy bizonyítékos lépéseket javasol, amelyeket maga a Lean 4 környezet ellenőrzi a logikai szilárdság biztosítása érdekében. Ennek a szinergia célja, hogy a formális ellenőrzés komplex feladatát kezelhetőbbé tegye. A szakértők keverékének (MOE) architektúrája-a tervezési útválasztási bemenet csak a paraméterek részhalmazába-csak egy frakció a következtetések során aktív, kiegyensúlyozva a skálát a számítási költségekkel. Ez a DeepSeek korábbi munkájára épül, beleértve a 7B paramétert DeepSeek-prover-v1.5 (2024. augusztus részletes), amely az EV-ből származik, az EV-ből, hogy az EV-ből származik, az EV-ből, hogy az EV-ből a Proof Assistant-tól származó, az Assistant Poury Assistant Poury Assistant-tól származó, az EV-ből, mint például a megerősítés tanulását. href=”https://arxiv.org/abs/2405.14333″Target=”_ üres”> prover munka (2024 május).

Ez a megközelítés különbözik a legutóbbi, magas rangú matematikai AI rendszerektől. A Google Deepmind alfageometria2, amely nemrégiben meghaladta az emberi aranyérmeseket a nemzetközi matematikai olimpia (IMO) geometriai problémáin, hibrid architektúrát alkalmaz, amely egy finomhangolt Ikrek nyelvű modellt és egy dedikált szimbolikus érvelő motorral (DDAR) kombinálódik. A

alfageometria is nagymértékben támaszkodott arra, hogy hatalmas mennyiségű szintetikus edzési adatot (több mint 300 millió tétel és bizonyíték) generáljon, hogy elérje teljesítményét a verseny stílusú geometriai problémáin. A DeepSeek korábbi prover modelljei ( v1.5 és v1 ) és olyan technikák, mint a megerősítő tanulás a bizonyítékos asszisztens visszajelzésekből (RLPAF) és a Monte Carlo Tree Search (MCTS) variánsokból, ami azt sugallja, hogy a prover v2 valószínűleg hasonló módszerekre épül, bár a 671b méretű mérettel jelentősen felmért. (SLMS). Olyan technikákat alkalmaz, mint az MCT-k, a kód-augnázott gondolkodási lánc (COT) érvelése (mind a természetes nyelvet, mind az igazolható Python-kódot előállítva), és egy folyamatpreferencia-modellt (PPM), hogy értékelje a közbenső lépéseket, lehetővé téve a 7 milliárd paramétermodellek számára, hogy nagy pontosságot érjenek el, mint például a GSM8K és a Math. Az alfageometria az olimpia geometriáját hibrid szimbolikus/idegi megközelítéssel célozza meg, és az RSTAR-MATH kisebb modelleket optimalizál a szélesebb matematikai érvelési feladatokhoz.

Geopolitical Crosshairs-ben fogva tartott

A kiadás akkor fordul elő, amikor a DeepSeek intenzív szabályozási hatással van. 2025 elején az Egyesült Államok Haditengerészete megtiltotta a biztonsági kockázatokkal szembeni használatát, amelyet hamarosan Texas követte az állami kormányzati eszközök chatbot alkalmazását. Ezt a nyomást az USA House Select Bizottságának április 16-i jelentése, a CCP „DeepSeek Unmasked” című április 16-i jelentése. A bizottság a társaság nemzetbiztonsági kockázatának nevezte. Részletes komoly állítások, az amerikai felhasználói adatok mélységének állítása, a és potenciális integrátumok nyomkövetési eszközökből, valamint potenciálisan integrátumokból származó innegratikus eszközökből. Kutatás a kiberbiztonsági cég Feroot Security-től.

The committee also alleged DeepSeek acquired “tens of thousands”of advanced chips, potentially violating US export laws, and requested Az NVIDIA közzéteszi az értékesítési információkat Bizonyos ázsiai nemzeteknek a végfelhasználók nyomon követése érdekében. Ezenkívül a jelentés kiemelte a szellemi tulajdon aggályait, hivatkozva az Openai tanúvallomásaira és a Microsoft biztonsági kutatók számára. A nem megfelelően használt technikák, például a modell desztillációja az amerikai modellek biztosításainak megkerülésével. 2025), közvetlenül a jelentős biztonsági és geopolitikai kihívások árnyékában fordul elő.

A DeepSeek a Massive 671B PROVER V2 modellt, amely a matematikai tételnek bizonyítja az R2 kiadását

Published by All Things Windows on April 30, 2025

Geopolitical Crosshairs-ben fogva tartott

IT Info

A ONEDRIVE megosztott mappák parancsikonjait.URL internetes hivatkozásokként jelennek meg, és kéri, hogy jelentkezzen be azok megtekintésére. (Lehetséges javítások)

IT Info

A SEC fellépés nélkül lezárja a PayPal PYUSD stablecoinjának vizsgálatát

IT Info

A Fehér Ház robbantja az Amazon-ot az „ellenséges és politikai cselekedet” termékoldalak tarifaköltségének megmutatására.

A DeepSeek a Massive 671B PROVER V2 modellt, amely a matematikai tételnek bizonyítja az R2 kiadását

Published by All Things Windows on April 30, 2025

Geopolitical Crosshairs-ben fogva tartott

Related Posts

IT Info

A ONEDRIVE megosztott mappák parancsikonjait.URL internetes hivatkozásokként jelennek meg, és kéri, hogy jelentkezzen be azok megtekintésére. (Lehetséges javítások)

IT Info

A SEC fellépés nélkül lezárja a PayPal PYUSD stablecoinjának vizsgálatát

IT Info

A Fehér Ház robbantja az Amazon-ot az „ellenséges és politikai cselekedet” termékoldalak tarifaköltségének megmutatására.