Cinese AI Lab DeepSeek ha rilasciato Deepseek-Prover-V2-671b, un modello di lingua eccezionalmente grande rivolto al teorema matematico, rendendolo disponibile su
Efficienza sotto i vincoli
queste restrizioni hardware, limitando l’accesso a GPUS di Top Thier. Efficienza computazionale. La società ha incorporato tecniche come l’attenzione latente multi-testa (MLA)-un approccio progettato per gestire in modo efficiente sequenze di dati lunghe (fino a 128.000 token nel suo modello di base V3)-e FP8 quantizzazione, un formato numerico a bassa precisione che riduce le esigenze di memoria, nella sua architettura del modello. src=”https://winbuzzer.com/wp-content/uploads/2025/01/deepseek.jpg”>
Questo focus di efficienza era precedentemente evidenziato quando Deepseek Open-Sourced Infrastructure Strumenti di Provastruttura per la Flashmla V24. Su un cluster sostanziale di 2048 GPU NVIDIA H800, secondo il suo Rapporto tecnico .
AI placca matematica formale
DeepSeek-Prover-V2-671b non è un chatbot generale ma un sistema altamente specializzato che si rivolge al teorema formale che dimostra, in particolare usando lean 4 Proof Language . Lean 4 è uno strumento interattivo utilizzato per formalizzare le definizioni e le prove matematiche e verificare la loro correttezza computazionalmente.
È un potente assistente di prova e un linguaggio di programmazione che fornisce il framework per esprimere argomenti matematici formalmente e computazionalmente verificando la loro correttezza. DeepSeek-Prover-V2 interagisce con questo framework, che probabilmente genera o suggerisce passi di prova nella sintassi di Lean 4, che vengono quindi controllati dall’ambiente Lean 4 stesso per garantire la solidità logica. Questa sinergia mira a rendere il complesso compito della verifica formale più gestibile.
Il modello utilizza un massiccio parametri totali di 671 miliardi, distribuiti nel sicuro safeTensor format. Tuttavia, l’architettura della sua miscela di esperti (MOE)-un input di routing di progettazione solo a un sottoinsieme di parametri: i mezzi solo una frazione sono attivi durante l’inferenza, bilanciamento della scala con i costi computazionali.
Le potenziali applicazioni includono la generazione automatica di prove graduali, rilevando errori nelle prove esistenti, addebitando l’insegnamento e la ricerca di ricerche. Questo si basa sul precedente lavoro di DeepSeek, incluso il parametro 7B deepseek-prover-v1.5 (dettagliato agosto 2024), che usavano tecniche come reinformance dall’assistente di prova (rlpf) e evolutivo da Lean da Lean e da href=”https://arxiv.org/abs/2405.14333″Target=”_ blank”> Prover Work (maggio 2024).
Questo approccio differisce dagli altri recenti sistemi di intelligenza artificiale di alto profilo. Alphageometry2 di Google DeepMind, che ha recentemente superato le medaglie d’oro umane su problemi di geometria delle Olimpiadi matematiche internazionali (IMO), impiega un’architettura ibrida che combina un modello di lingua gemina messa a punto con un motore di ragionamento simbolico dedicato (DDAR).
Alphageometry2 ha anche fatto affidamento fortemente sulla generazione di grandi quantità di dati di addestramento sintetico (oltre 300 milioni di teoremi e prove) per raggiungere le sue prestazioni sui problemi di geometria in stile concorrenza. I primi modelli Prover di DeepSeek ( v1.5 e v1 Generazione e tecniche come l’apprendimento del rinforzo da prove Assistant Feedback (RLPAF) e varianti di Monte Carlo Tree Search (MCTS), suggerendo che Prover V2 probabilmente si basa su metodi simili, sebbene si siano ridimensionati in modo significativo per le sue dimensioni 671b. (SLMS). Utilizza tecniche come MCT, ragionamento a catena di procura (COT) (COT) (PPM) di un modello di preferenza di processo (PPM) per valutare i passi intermedi, consentendo a una scala di passi da letto per le prove di 7 miliardi 4, l’alfageometria prende di mira la geometria delle olimpiadi con un approccio simbolico/neurale ibrido e RSTAR-Math ottimizza i modelli più piccoli per attività di ragionamento matematica più ampie.
Le potenziali applicazioni per le ricerche di Deep Seek-Prover-V2 includono la generazione automatica di prove del padiglione, nel rilevamento di errori nel corso di allenamenti 4 nell’esplorazione di ricercatori nel campo dei cibi in modo automatico e nell’esplorazione dei corsi di trasmissione 4 nell’esplorazione dei covoni in fase di trasmissione 4 nell’esplorazione di rischiate 4 nell’esplorazione di rischiate 4 nell’esplorazione di rischiate 4 nell’esplorazione di rischiate 4 nell’esplorazione di rischiate 4 nell’esplorazione di rischiate 4 nell’esplorazione di rischiazioni in fascia Ecosistema.
catturato nel mirino geopolitico
Il rilascio si verifica quando DeepSeek affronta un’intensa azione regolatoria. All’inizio del 2025, la Marina degli Stati Uniti ha vietato il suo utilizzo sui rischi per la sicurezza, seguita a breve da Texas che vietava l’app Chatbot sui dispositivi del governo statale.
Discussioni su potenziali più ampie restrizioni del governo statunitense emerse anche in questo periodo. Questa pressione è stata significativamente amplificata da un rapporto del 16 aprile del comitato Select US House sul PCC intitolato”DeepSeek Unmasked”. Il comitato ha etichettato alla società un rischio per la sicurezza nazionale.
Il presidente del comitato John Moolenaar ha dichiarato:”Questo rapporto chiarisce: Deepseek non è solo un’altra app di intelligenza artificiale-è un’arma nell’arsenale del partito comunista cinese, progettato per spiare gli americani, rubare la nostra tecnologia e la nostra legge subacquea. Rapporto del comitato per le accuse dettagliate, rivendicando DeepSeek Funnels American User Data di nuovo in Cina tramite infrastruttura connessa a by bya> e potenzialmente integranti e potenziali di monitoraggio e potenzialmente integrati e potenziali da parte di monitoraggio e potenzialmente integranti e potenziali da parte della cinese. Tencent, citando la ricerca della società di sicurezza informatica Ferroot Security.
Il comitato ha anche affermato che DeepSeek ha acquisito”decine di migliaia”di chip avanzati, potenzialmente violando le leggi sulle esportazioni statunitensi e A alcune nazioni asiatiche per tenere traccia degli utenti finali. Inoltre, il rapporto ha messo in evidenza le preoccupazioni sulla proprietà intellettuale, il riferimento alla testimonianza di OpenAI e sui risultati di