Chiński startup AI Deepseek potwierdził 28 maja „drobne ulepszenie prób” do swojego modelu sztucznej inteligencji R1. Model miał kluczowe znaczenie dla podniesienia globalnego profilu firmy na początku roku. Użytkownicy mogą teraz przetestować ulepszoną wersję.
Deepseek zapewniono, że jej interfejs API i metody użytkowania pozostają niezmienione, zgodnie z oficjalnym ogłoszeniem firmy za pośrednictwem kanału WeChat firmy, odnotowanego przez . Ten przyrostowy krok sygnalizuje ciągły rozwój Deepseek w konkurencyjnym polu AI i pod znaczną presją geopolityczną.
Firma zachęca do opinii na temat aktualizacji za pośrednictwem oficjalnej strony internetowej, aplikacji mobilnej i mini-programu. Ta aktualizacja jest najnowszym z serii osiągnięć Deepseek. Firma konsekwentnie wydawała modele i narzędzia podczas nawigacji między międzynarodową kontrolą. Znaczenie dla użytkowników i branży polega na obserwowaniu iteracyjnych ulepszeń Deepseek i jego zdolności do zarządzania zewnętrznymi wyzwaniami.
R1 Evolution i Broader Contekst
, ponieważ Deepseek R1 został wydany jako open source, widział także kilka modyfikacji stron trzecich. Kłopot AI wprowadził R1 1776 jako wariant bez cenzury w lutym, ponieważ oryginalny model R1 zawiera mechanizmy filtrowania treści. TNG Technology Consulting opublikował swój model DeepSeek-R1T-Chimera w kwietniu, który ma na celu połączenie rozumowania R1 z wydajnością punktu kontrolnego V3-0324 Deepseeka, który został wydany w marcu.
Deepseek aktywnie przyczynił się również do AI open source. W kwietniu 2025 r. Firma zainicjowała inicjatywę typu open source, wydając Flashmla, wydajne jądro dekodujące MLA. Deepseek opisał to jako dzielenie się „małym, ale szczerym postępem”. Pod koniec kwietnia Deepseek wydał następnie Deepseek-Prover-V2-671B jako inny model, którego celem jest potwierdzenie matematyczne.
Firma również open soczyste open System Fire File (3FS) i we współpracy z Uniwersytetem Tsinghua, wprowadzonym samozatrudnionym stuningiem Concquique (SPCT), innowacyjnej techniki AI.
Naciski geopolityczne i odpowiedzi strategiczne
Postępy Deepseek występują wśród intensywnych geopolitycznych wiatrów. Komitet Wyboru Wyboru USA w kwietniu określił, że spółka narodowa jest zagrożeniem bezpieczeństwa narodowego. „Ten raport wyjaśnia: Deepseek to nie tylko kolejna aplikacja AI-jest bronią w arsenalu chińskiej partii komunistycznej, zaprojektowanej do szpiegowania Amerykanów, kradzieży naszej technologii i obalenia prawa USA.”, Przewodniczący komitetu John Moolenaar.
W odpowiedzi na takie presję i ograniczenia stałe, w szczególności ograniczony dostęp do najwyższego poziomu Nvidia GPUs z powodu Export Export, a także próby, które są exportem, produkuje się na koncentrację. W sprawie wydajności obliczeniowej.
Obejmuje to techniki takie jak wielorakie utajone (MLA) i kwantyzacja FP8, nisko precyzyjny format numeryczny, który zmniejsza potrzeby pamięci. Ten koncentracja na wydajność została zatwierdzona, gdy chiński konkurent Tencent, podczas połączenia z zarobkami w 2024 r., Potwierdziło wykorzystanie modeli Deepeek.
Konkurencyjny krajobraz AI nadal napędza rozwój Deepseek. Raporty z kwietnia wskazują, że DeepSeek przyspieszył wprowadzenie swojego modelu R2 nowej generacji, początkowo zaplanowanego na maj 2025 r. Oczekuje się, że model R2 poprawi się z wcześniejszych ograniczeń R1 w zaawansowanych możliwościach rozumowania i kodowania.