Chinese AI lab DeepSeek has released DeepSeek-Prover-V2-671B, an exceptionally large language model aimed at mathematical theorem proving, making it available on Hugging Face. Η απελευθέρωση συνεχίζει το μοτίβο της εταιρείας ανοικτής πηγής ισχυρών μοντέλων, ακόμη και όταν πλοηγεί στον έντονο γεωπολιτικό έλεγχο, ιδιαίτερα από τις Ηνωμένες Πολιτείες, και προσαρμόζεται στην ενίσχυση των επόμενων ελέγχων εξαγωγών σε προηγμένο υλικό υπολογιστών που έχουν τεθεί σε ισχύ από το τέλος του 2022. Παλαιότερα από το προγραμματισμένο ανάπτυξη, καθώς μάχεται να σφίγγει τους κανονισμούς των ΗΠΑ και των ευρωπαϊκών και εντατικοποιητικών ανταγωνισμού από τους περιορισμούς του OpenAI, Google, Anthropic, XAI και Alibaba. απόδοση. Η εταιρεία ενσωμάτωσε τεχνικές όπως η πολυεπίπεδη λανθάνουσα προσοχή (MLA)-μια προσέγγιση που έχει σχεδιαστεί για την αποτελεσματική διαχείριση μακρών αλληλουχιών δεδομένων (έως και 128.000 μάρκες στο μοντέλο βάσης V3)-και το FP8 κβαντισμό, μια αριθμητική μορφή χαμηλής ακρίβειας που μειώνει τις ανάγκες της μνήμης, στην αρχιτεκτονική μοντέλου της. src=”https://winbuzzer.com/wp-content/uploads/2025/01/deepseek.jpg”>
Αυτή η εστίαση απόδοσης είχε επισημανθεί προηγουμένως όταν το Deepseek Open Sour-Sourced Tools ήταν εργαλεία υποδομής όπως το Flashseek. Εκπαιδεύτηκε σε ένα σημαντικό σύμπλεγμα 2048 NVIDIA H800 GPU, σύμφωνα με το Τεχνική αναφορά
deepseek-prover-v2-671b δεν είναι ένα γενικό chatbot, αλλά ένα εξαιρετικά εξειδικευμένο σύστημα που στοχεύει το επίσημο θεώρημα που αποδεικνύει, ειδικά χρησιμοποιώντας το lean Βοηθός Γλώσσα . Το Lean 4 είναι ένα διαδραστικό εργαλείο που χρησιμοποιείται για την επισημοποίηση των μαθηματικών ορισμών και των αποδεικτικών στοιχείων και για τον έλεγχο της ορθότητας τους υπολογιστικά. Το Deepseek-Prover-V2 αλληλεπιδρά με αυτό το πλαίσιο, πιθανόν να δημιουργεί ή να προτείνει βήματα απόδειξης στη σύνταξη Lean 4, τα οποία στη συνέχεια ελέγχονται από το ίδιο το περιβάλλον Lean 4 για να εξασφαλίσουν λογική ευρωστία. Αυτή η Synergy στοχεύει να καταστήσει το σύνθετο έργο της επίσημης επαλήθευσης πιο εύχρηστη. Ωστόσο, η αρχιτεκτονική του μείγματος των ειδών (MOE)-μια εισροή δρομολόγησης σχεδιασμού μόνο σε ένα υποσύνολο παραμέτρων-σημαίνει ότι μόνο ένα κλάσμα είναι ενεργό κατά τη διάρκεια της συμπερίληψης, της εξισορρόπησης της κλίμακας με υπολογιστικό κόστος. Αυτό βασίζεται στην προηγούμενη εργασία του Deepseek, συμπεριλαμβανομένης της παραμέτρου 7B deepseek-prover-v1.5 (λεπτομερής Αύγουστος 2024) href=”https://arxiv.org/abs/2405.14333″target=”_ blank”> prover work (Μάιος 2024).
Αυτή η προσέγγιση διαφέρει από άλλα πρόσφατα συστήματα μαθηματικών υψηλού προφίλ. Η Alphageometry2 της Google DeepMind2, η οποία ξεπέρασε πρόσφατα τα ανθρώπινα χρυσά μετάλλια στη διεθνή μαθηματική Ολυμπιάδα (IMO) προβλήματα γεωμετρίας, απασχολεί μια υβριδική αρχιτεκτονική που συνδυάζει ένα μοντέλο γλωσσικής γλωσσών με εξειδίκευση με έναν ειδικό συμβολικό μηχανισμό λογικής (DDAR).
Η Alphageometry2 βασίστηκε επίσης σε μεγάλο βαθμό στη δημιουργία τεράστιων ποσοτήτων δεδομένων συνθετικής κατάρτισης (πάνω από 300 εκατομμύρια θεωρήματα και αποδείξεις) για να επιτύχει την απόδοσή του σε προβλήματα γεωμετρίας τύπου ανταγωνισμού. Τα προηγούμενα μοντέλα Prover του Deepseek ( v1.5 Και οι τεχνικές όπως η ενίσχυση της μάθησης από την ανατροφοδότηση του Assistant Proof (RLPAF) και των παραλλαγών Monte Carlo Tree Search (MCTS), υποδηλώνοντας ότι η Prover V2 πιθανόν να επικεντρώνεται στην ενίσχυση των μεθόδων, αν και κλιμακώνεται σημαντικά για τα μικρά μοντέλα της SLMS (SLMS). Χρησιμοποιεί τεχνικές όπως το MCTS, τη συλλογιστική αλυσίδα αλυσίδων (COT) (που παράγει τόσο τη φυσική γλώσσα όσο και το επαληθεύσιμο κώδικα Python) και ένα μοντέλο προτίμησης της διαδικασίας (PPM) για την αξιολόγηση των ενδιάμεσων βημάτων, που επιτρέπουν τα μοντέλα των 4 δισεκατομμυρίων παραμέτρων για να επιτύχουν υψηλή περιγραφή σε σημεία αναφοράς όπως GSM8K και Math. Η αλφαγομετρία στοχεύει στη γεωμετρία της Ολυμπιάδας με μια υβριδική συμβολική/νευρωνική προσέγγιση και το RSTAR-Math βελτιστοποιεί τα μικρότερα μοντέλα για τις ευρύτερες εργασίες μαθηματικών.
Πιάστηκε σε γεωπολιτικά crosshairs
Η απελευθέρωση εμφανίζεται καθώς το DeepSeeek αντιμετωπίζει έντονη ρυθμιστική δράση. Στις αρχές του 2025, το αμερικανικό ναυτικό απαγόρευσε τη χρήση του έναντι των κινδύνων ασφαλείας, ακολουθούμενη σύντομα από το Τέξας που απαγορεύει την εφαρμογή chatbot σε κρατικές κυβερνητικές συσκευές. Αυτή η πίεση ενισχύθηκε σημαντικά από μια έκθεση της 16ης Απριλίου από την Επιτροπή Επιλογής των ΗΠΑ για το CCP με τίτλο”Deepseek Unmasked”. Η επιτροπή χαρακτήρισε την εταιρεία έναν κίνδυνο εθνικής ασφάλειας.
Ο πρόεδρος της επιτροπής John Moolenaar δήλωσε:”Αυτή η έκθεση καθιστά σαφές: Deepseek δεν είναι απλώς μια άλλη εφαρμογή AI-είναι ένα όπλο στο οπλοστάσιο του Κινέζικου Κομμουνιστικού Κόμματος, που σχεδιάστηκε για να κατασκοπεύει τους Αμερικανούς, να κλέβει την τεχνολογία μας και να υπονομεύσει τον αμερικανικό νόμο. Αναφορά λεπτομερών ισχυρισμών, υποστηρίζοντας ότι η DeepSeek διοχετεύει τα αμερικανικά δεδομένα χρήστη πίσω στην Κίνα μέσω υποδομής που συνδέεται με το Tencent, αναφέροντας την έρευνα από την εταιρεία Cybersecurity Feroot Security.
Η επιτροπή ισχυρίστηκε επίσης ότι η Deepseek απέκτησε”δεκάδες χιλιάδες”προηγμένα μάρκες, ενδεχομένως παραβίαζε τους νόμους εξαγωγής των ΗΠΑ και