Deepseek uwalnia eksperymentalny model V3.2 AI z „rzadką uwagą", aby zwiększyć wydajność

Chiński programista AI Deepseek wydał Deepseek-V3.2-EXP, model eksperymentalny, który nazywa „pośrednim krokiem” w kierunku architektury nowej generacji. T

Firma z siedzibą w Hangzhou ogłosiła w poniedziałek model open source, ujawniając, że został zaprojektowany do testować nową, bardziej wydajną metodę przetwarzania długości tekstu . solidny. Jego bardzo oczekiwany model R2 został opóźniony na czas nieokreślony na początku tego roku wśród niedoborów sprzętu. W równoczesnym posunięciu, który nasila chińską wojnę cenową AI AI, Deepseek ogłosił również, że jest , wywierając bezpośredni presja na krajowych rywali.

Eksperymentalny sklep z deepseek innowacja innowacja jest mechanizmem, który firma nazywa Deepseek rzadką uwagę (DSA).

Jako wydanie eksperymentalne, nowy model opiera się na swoim poprzedniku, v3.1-terminus, ze szczególnym celem eksploracji i potwierdzenia optymalizacji w celu uzyskania uwagi na temat treningu i wnioskowania w długim kontekście scenariuszy. Ta nowa architektura jest zaprojektowana w celu zapewnienia znacznej poprawy wydajności obliczeniowej Podczas przetwarzania rozszerzonych sekwencji tekstowych, kluczowe wąskie gardło dla wielu aplikacji AI na dużą skalę, przy jednoczesnym zachowaniu wirtualnie identycznej jakości wyjściowej.

w celu rygorystycznego udowodnienia wpływu nowej architektury, Deepseek dokonał strategicznego wyboru, aby uniknąć ścigania SCORES FINERTORD. V3.2-EXP z V3.1-końcowym. Dane porównawcze pokazują dwa modele działające prawie identycznie w testach rozumowania i kodowania, izolując wzrost wydajności jako jedyną zmienną.

Model jest dostępna na platformie misjącej w przypadku licencji mit na mit. adopcja. Deepseek wydał również jądra open source zarówno do badań, jak i wysokiej wydajności, sygnalizując silne zaangażowanie w angażowanie społeczności programistów z innowacją architektoniczną.

strategiczne obrotowe, po tym, jak Model R2 stragan

To eksperymentalne uwolnienie następuje w dupeku, magicznym meczu strategicznym. nieokreślony w martwym punkcie w połowie 2025 r.

Opóźnienie było bezpośrednią konsekwencją wojny technologicznej USA-Chiny, która poważnie ograniczyła dostęp do wysokowydajnych układów NVIDIA niezbędnych do szkolenia zaawansowanego AI.

Opóźnienie nieokreślone oznaczało oszałamiające odwrócenie. Zaledwie kilka miesięcy wcześniej Deepseek podobno szybko śledził wydanie R2, aby wymieniać rywali. Jednak ten pęd zderzył się z tym, co początkowo opisano jako kryzys na dwóch frontach: wewnętrzne niezadowolenie dyrektora generalnego nad wydajnością i okaleczającym wąskim gardłem.

Kolejne raporty w sierpniu potwierdziły, że podstawowym problemem była trwałe niepowodzenie techniczne. Firma nie była w stanie ukończyć udanego szkolenia przy użyciu krajowych układów wznoszących się Huawei, zmuszając trudne obrotowe obrót do udowodnienia sprzętu NVIDIA do fazy intensywnej obliczeniowej. walczył. Prace firmy pozostają również pod intensywną analizą geopolityczną.

Raport oszczędny amerykański komitet domowy z kwietnia nazwał firmę zagrożeniem bezpieczeństwa, z przewodniczącym John Moolenaar stwierdza: „Deepseek to nie tylko kolejna aplikacja AI-to broń w arsenale chińskiej partii komunistycznej…”

Oprócz wersji technicznej Deepseek ogłosił dramatyczne obniżenie cen API o „50%+”. Ta agresywna cena jest bezpośrednim strzałem w krajowych konkurentach, którzy erodowali swój udział w rynku. Posunięcie eskaluje zaciętą wojnę cenową, która zboczyła chiński sektor AI.

Firma reaguje na presję ze strony rywali, takich jak Z.ai (wcześniej ZHIPU), która uruchomiła w lipcu swój potężny model GLM-4.5 z wyraźną strategią, aby podcinać Deepeek na cenie Model.

Pomimo ostatnich przeszkód rozwojowych technologia Deepseek pozostaje bardzo poszukiwana. W znacznej wygranej Tesla ogłosił w sierpniu, że zintegruje AI z Deepseek i Bytedance dla asystentów głosowych na rynku krytycznym, odrzucając własną strategię Elona Muska. Ma na celu ponowne zaangażowanie społeczności deweloperów, odzyskanie jej przewagi konkurencyjnej w zakresie kosztów i sygnalizowanie, że jego rurociąg innowacyjny jest aktywny, nawet gdy porusza surową rzeczywistość globalnej wojny chipowej.

Deepseek uwalnia eksperymentalny model V3.2 AI z „rzadką uwagą”, aby zwiększyć wydajność

Published by All Things Windows on September 29, 2025

strategiczne obrotowe, po tym, jak Model R2 stragan

IT Info

Jak technologie geolokalizacji i mapowania przekształcają aplikacje podróży i przygody

IT Info

Microsoft ponownie łączy zespoły inżynieryjne Windows, aby przyspieszyć „agentowy system operacyjny” napędzany sztuczną inteligencją

IT Info

Kalifornijskie podpisuje pierwsze główne prawo bezpieczeństwa AI, zmuszające przejrzystość gigantów technologicznych

Deepseek uwalnia eksperymentalny model V3.2 AI z „rzadką uwagą”, aby zwiększyć wydajność

Published by All Things Windows on September 29, 2025

strategiczne obrotowe, po tym, jak Model R2 stragan

Related Posts

IT Info

Jak technologie geolokalizacji i mapowania przekształcają aplikacje podróży i przygody

IT Info

Microsoft ponownie łączy zespoły inżynieryjne Windows, aby przyspieszyć „agentowy system operacyjny” napędzany sztuczną inteligencją

IT Info

Kalifornijskie podpisuje pierwsze główne prawo bezpieczeństwa AI, zmuszające przejrzystość gigantów technologicznych