Startup AI Chinese Deepseek a lansat o actualizare notabilă a modelului său de inteligență artificială R1, desemnat Deepseek-R1-0528, îmbunătățindu-și semnificativ capacitățile și poziționându-l mai aproape de sistemele globale de top. În ciuda unor câștiguri notabile de performanță, compania consideră noul model o „actualizare minoră”. Acest lucru este semnificativ pentru utilizatori și pentru industria mai largă, evidențiind progresul rapid al firmelor AI chineze și promițând instrumente AI mai puternice, mai fiabile, intensificând astfel concurența AI globală.
Deepseek Asserts Performanța generală se „abordează cu cea a modelelor de frunte, cum ar fi O3 și Gemini 2.5 Pro”. Această îmbunătățire, potrivit Deepseek AI, este rezultatul creșterii resurselor de calcul și a noilor mecanisme de optimizare algoritmică aplicate în faza sa de post-instruire.
Pentru utilizatori, acest lucru se traduce prin așteptări ale unor rezultate mai precise și relevante din punct de vedere contextual, în special atunci când abordează sarcini complexe. Compania a subliniat, de asemenea, că versiunea R1-0528 oferă un suport îmbunătățit pentru apelarea funcțiilor, permițând o mai bună interacțiune cu instrumentele externe și o experiență îmbunătățită pentru „codificarea vibrației”, sugerând o generație mai intuitivă a codului, așa cum este menționat în anunțul lor.
cea mai recentă iterație a DeepSeek R1 continuă să utilizeze un amestec-of-Experts (MoE), cu aproximativ 670 Parametri, dar activează doar aproximativ 37 de miliarde pe jeton în timpul inferenței.
Capabilități îmbunătățite și gândire mai profundă
Deepseek cuantifică saltul de performanță cu rezultate specifice de referință. În special, în testul AIME 2025, o competiție de matematică provocatoare, precizia modelului a crescut de la 70% la 87,5%.
Acest lucru este atribuit unei profunzimi mai mari de raționament; Noul model a înregistrat o medie de 23.000 de jetoane-unități de text procesate-cu privire la acest test, o creștere semnificativă față de 12.000 de jetoane anterioare. Demonstrând în continuare priceperea sa, pe clasamentul LiveCodebenchench, menținut de cercetătorii de la UC Berkeley, MIT și Cornell, noul Deepseek R1-0528 au depășit Grok-3-3-Mini și Alibaba, QWEN-3. Dar informațiile false rămân o provocare persistentă. Dezvoltatorii care testează modelul au observat, de asemenea, că R1-0528 Engages în @longer”thearge sessions, reportedly spending 30 to 60 minutes on single tasks when needed,” indicating a shift towards more thorough responses. The maximum generation length for the model is a substantial 64,000 tokens.
Availability, Open Source, and Community Reception
Users can interact with the enhanced model via Website-ul oficial al lui Deepseek Activând opțiunea „DeepThink” Modelul R1-0528 este, de asemenea, accesibil cu o API gratuită prin OpenRouter. Comunitatea, Deepseek a lansat, de asemenea, Deepseek-R1-0528-QWEN3-8B. Licență MIT , permițând utilizarea comercială și distilarea. href=”https://unsloth.ai/blog/deepseek-r1-0528″target=”_ blank”> postare pe blog că au cuantificat cu succes modelul R1 671B-parametru al Deepseek de la 720 GB până la 185 GB, o reducere de 75%, făcând-o mai accesibilă pentru uz local în timp ce menținând funcția puternică. și realități geopolitice
În timp ce Deepseek Hugging Face Post detaliază un upgrade semnificativ, unii au caracterizat lansarea în The Express Tribune , care a menționat și un reprezentant profund, care descrie în mod similar în grupul privat. Pregătirile pentru modelul său de raționament R2 de generație următoare, a cărui lansare a fost accelerată pentru a concura mai bine cu laboratoarele AI globale.
originalul Deepseek R1 a făcut un impact semnificativ la începutul anului prin depășirea Openai OpenAI pe mai multe repetări de raționament, precum și perplexul. Deepseek a contribuit în mod constant la AI-ul open-source, eliberând instrumente precum Kernel-ul de decodare Flashmla și modelul Deepseek-Prover-V2-671b pentru teorema matematică care dovedește. Raportul a arătat că Deepseek nu a fost doar o altă aplicație AI, ci „o armă în arsenalul Partidului Comunist Chinez, conceput pentru a spiona americanii, a fura tehnologia noastră și a subverti legea SUA. La sfârșitul anului 2024.