Lab AI Cina DeepSeek telah mengeluarkan DeepSeek-prover-v2-671b, model bahasa yang sangat besar yang bertujuan untuk membuktikan teorem matematik, menjadikannya tersedia pada V2, dilatih pada kelompok besar 2048 NVIDIA H800 GPU, menurut DeepSeek-Prover-V2-671b bukanlah chatbot umum tetapi sistem yang sangat khusus mensasarkan teorem formal yang membuktikan, khususnya menggunakan
Ia adalah pembantu bukti yang kuat dan bahasa pengaturcaraan yang menyediakan rangka kerja untuk menyatakan hujah-hujah matematik secara formal dan mengiris mengesahkan ketepatan mereka. DeepSeek-Prover-V2 berinteraksi dengan rangka kerja ini, mungkin menghasilkan atau mencadangkan langkah-langkah bukti dalam sintaks Lean 4, yang kemudiannya diperiksa oleh persekitaran Lean 4 itu sendiri untuk memastikan kekukuhan logik. Sinergi ini bertujuan untuk menjadikan tugas kompleks pengesahan formal lebih mudah diurus.
Model ini menggunakan 671 bilion parameter besar, yang diedarkan dalam selamat DeepSeek-V1.5 < prover work (Mei 2024).
Pendekatan ini berbeza dari sistem AI matematik berprofil tinggi baru-baru ini. Alphageometry2 Google Deepmind, yang baru-baru ini melepasi pingat emas manusia pada masalah geometri matematik antarabangsa (IMO), menggunakan seni bina hibrid yang menggabungkan model bahasa Gemini yang disempurnakan dengan enjin penalaran simbolik khusus (DDAR).
Alphageometry2 juga sangat bergantung pada menghasilkan sejumlah besar data latihan sintetik (lebih 300 juta teorem dan bukti) untuk mencapai prestasinya mengenai masalah geometri gaya persaingan. Model Prover sebelumnya DeepSeek ( v1.5 dan