Startup AI chinezesc Deepseek a confirmat pe 28 mai o „actualizare minoră de încercare” la modelul său de inteligență artificială R1. Modelul a fost crucial în creșterea profilului global al companiei la începutul anului. Utilizatorii pot testa acum versiunea îmbunătățită.
Deepseek au asigurat că interfața API și metodele de utilizare rămân neschimbate, potrivit unui anunț oficial al companiei prin intermediul unei companii WeChat Channel, menționat de
Evoluția R1 și a modelul mai larg a modelelor și a contextului mai larg. Diverse iterații și adopții de la prima sa lansare de impact, care a depășit OpenAI O1-Modelul de frunte la acea vreme-pe mai multe repere de referință.
ca Deepseek R1 a fost lansat ca sursă deschisă, a observat, de asemenea, mai multe modificări terțe părți. Perplexity AI a introdus R1 1776 ca o variantă fără cenzură în februarie, deoarece modelul original R1 include mecanisme de filtrare a conținutului. TNG Technology Consulting a lansat modelul Deepseek-R1T-Chimera în aprilie, care își propune să combine raționamentul R1 cu eficiența punctului de control V3-0324 de la Deepseek, care a fost lansat în martie
Deepseek a contribuit în mod activ și la AI-source. În aprilie 2025, compania a inițiat o inițiativă open-source, lansând Flashmla, un nucleu eficient de decodare MLA. Deepseek a descris acest lucru ca fiind împărtășind „progrese mici, dar sincere”. La sfârșitul lunii aprilie, Deepseek a lansat apoi Deepseek-Prover-V2-671b ca un alt model, care vizează dovedirea teoremei matematice.
Compania și-a aprovizionat sistemul de fișiere cu fâșii de foc (3FS) și, în colaborare cu Universitatea Tsinghua, a introdus critici auto-imprincite (SPCT), un inovator A
presiuni geopolitice și răspunsuri strategice
Progresul Deepseek apar pe fondul unor răsărite geopolitice intense. Un comitet de selectare a casei din SUA pentru CCP în aprilie a etichetat companiei un risc de securitate națională. “This report makes it clear: DeepSeek isn’t just another AI app — it’s a weapon in the Chinese Communist Party’s arsenal, designed to spy on Americans, steal our technology, and subvert U.S. law.”, stated Committee Chairman John Moolenaar.
In response to such pressures and hardware restrictions, particularly limited access to top-tier Nvidia GPUs due to US export controls, DeepSeek has strategically axat pe eficiența calculațională.
Aceasta implică tehnici precum atenția latentă cu mai multe cap (MLA) și cuantificarea FP8, un format numeric cu precizie scăzută care reduce nevoile de memorie. Acest accent de eficiență a fost validat atunci când concurentul chinez Tencent, în timpul apelului său de venituri din Q4 2024, a confirmat utilizarea modelelor Deepseek.
Peisajul AI competitiv continuă să conducă dezvoltarea Deepseek. Rapoartele din aprilie a indicat că Deepseek a accelerat lansarea modelului său R2 de generație următoare, planificat inițial pentru mai 2025. Modelul R2 este de așteptat să se îmbunătățească la limitările notate anterioare ale R1 în raționamentul avansat și capacitățile de codificare.