W tym tygodniu zespół QWen Alibaba wydał nowy flagowy model rozumowania typu open source, który wstrząsnął branżą AI. Model QWEN3-235B-A22B-Myślenie-2507 zaprezentował 25 lipca, przewyższył już kluczowe testy branżowe, przewyższając potężne systemy zastrzeżone z rywali takich jak Google i Openai.
Uruchomienie oznacza znaczącą strategiczną zmianę dla giganta technologicznego chińskiego. Porzuca swoje poprzednie podejście „myślenia hybrydowego” do szkolenia oddzielnych, wyspecjalizowanych modeli dla złożonych rozumowania i szybkiego instrukcji. Ten ruch ma na celu dostarczenie wyższej jakości i zapewnienie programistom najnowocześniejszych narzędzi AI.
Nowy King Open-Source King: QWen3-Myślenie jest na szczycie wykresów porównawczych
Nowy model QWEN3-Myślenie o najnowocześniejszych wynikach. Jego wydajność nie ogranicza się do jednej niszy; Zamiast tego pokazuje dobrze zaokrągloną i potężną zdolność w złożonym rozumowaniu, kodowaniu i wyrównaniu użytkowników, ustalając nowy standard dla AI open source.
W dziedzinie zaawansowanego rozumowania matematycznego i logicznego model okazał się wyjątkowo zdolny. W odniesieniu AIME25 test zaprojektowany w celu oceny wyrafinowanych, wieloetapowych umiejętności rozwiązywania problemów, QWEN3-Myślenie-2507 uzyskał niezwykły wynik 92,3. Stawia to przed niektórymi z najpotężniejszych własnych modeli, w szczególności przewyższając Google’s Gemini-2,5 Pro, który opublikował wynik 88,0 w tej samej ocenie.
Sprawność modelu rozszerza się na krytyczną domenę rozwoju oprogramowania. Po przetestowaniu na LiveCodeBench V6, odniesieniu, który ocenia zdolność sztucznej inteligencji do obsługi zadań kodowania w świecie rzeczywistym, myślenie QWEN3 zapewniło najwyższy wynik 74,1. Wydajność to wygodnie wyprzedza zarówno O4-Mini (72.5), jak i O4-Mini (71,8), pokazując swoją praktyczną użyteczność dla programistów i zespołów inżynieryjnych.
Poza umiejętnościami inteligencji i kodowania surowej, model wyróżnia się również w wyrównaniu człowieka i subiektywnych preferencjach. Zajęło to pierwsze miejsce w stawce V2 na arenie, który mierzy, że użytkownicy modeli preferują w porównaniach. Ten wiodący wynik 79,7 wskazuje nie tylko silne umiejętności techniczne, ale także wysoki stopień użyteczności, spójności i bezpieczeństwa w wygenerowanych odpowiedzi.
Możliwości modelu sygnalizują kluczowy moment, w którym alternatywy open source nie są już po prostu nadrabiające zaległości, ale teraz bezpośrednio konkurują na granicy rozumu AI.
To przełomowe wydanie stanowi główny strategiczny punkt obrotu dla działu AI Alibaba, sygnalizując celową i starannie rozważaną ewolucję w filozofii rozwoju. Firma ogłosiła, że oficjalnie porzuca tryb „myślenia hybrydowego”, który był podstawową cechą wcześniejszych modeli QWEN3. To początkowe podejście wymagało ręcznego przełączania się między trybami szybkiego opracowywania instrukcji a głębokim rozumowaniem przy użyciu specjalnych tokenów, systemem, który może wprowadzić złożoność i niespójność.
Decyzja o odejściu od tej hybrydowej architektury była spowodowana zaangażowaniem w jakość i bezpośrednie informacje zwrotne ze społeczności deweloperów. W formalnym stwierdzeniu
Leżące u podstaw nowego modelu myślenia jest wyrafinowaną i wysoce wydajną architekturą mieszanki ekspertów (MOE). Podczas gdy model zawiera ogromne 235 miliardów parametrów całkowitych, zapewniając mu ogromne repozytorium wiedzy, aktywuje jedynie szczupły 22-miliardowy podzbiór dla dowolnego modelu wskaźnikowego. Modele. Dalej zwiększając swoje możliwości, model oferuje duże okno kontekstowe 262 144-letnie, które stanowi znaczący wzrost w stosunku do poprzednich wersji i jest kluczową funkcją dla zaawansowanych aplikacji korporacyjnych. Ta ogromna pojemność umożliwia modelu przetwarzanie i rozumowanie przez ogromne ilości informacji w jednym przejściu, takie jak analiza repozytoriów kodu oprogramowania, trawienie długich dokumentów prawnych lub finansowych lub utrzymanie doskonałego wycofania nad rozszerzonym, złożonym interakcjami użytkownika bez utraty wątku rozmowy. Power przed przedsiębiorstwem z dopuszczalnym licencjonowaniem
To otwarte podejście jest w wyraźnym kontraście z modelami bramkowymi API od konkurentów. Daje to przedsiębiorstwom pełną kontrolę nad ich prywatnością, bezpieczeństwem, kosztami i opóźnieniami, zajmując się kluczowymi problemami dla firm działających w branżach regulowanych lub z poufnymi informacjami.
Model jest dostępny do pobrania na przytulaniu twarzy i można go uzyskać za pośrednictwem API. Ceny są ustawione na 0,70 USD za milion tokenów wejściowych i 8,40 USD za tokeny produkcyjne , z wolnym poziomem deweloperów. href=”https://openrouter.ai/models/qwen/qwen3-235b-a22b-thing-2507″target=”_ blank”> Uzyskaj dostęp do modelu za pomocą platform takich jak OpenRouter . Jest to kompatybilny z ramami agencyjnymi, takimi jak qwen-agent , ułatwiając integrację do złożonych, zautomatyzowanych przepływów pracy, które wymagają planowania i użycia narzędzia.
The Broader QWen EcosyM: z kodem SMART do Smart do Smart do Smart. Szklanki
Model myślenia QWEN3 jest najnowszym w szybkiej kolejności uwolnień z Alibaba. Zespół QWEN niedawno wprowadził również nowy masywny model koderowy 480B-parametrowy i wielojęzyczny model tłumaczenia, budujący kompleksowy ekosystem AI open source. Od ogólnego rozumowania i translacji aktywności. Strategia wydaje się być jedną z pełnego zestawu potężnych, otwartych narzędzi dla programistów.
Czas tego wydania był wyraźnie strategiczny. Nadszedł zaledwie dzień, zanim Alibaba zapoczątkowała nowe mądre okulary „Quark AI” na World Artificial Intelligence Conference w Szanghaju. Szklanki są zasilane nową serią QWEN3, ruch zaprojektowany w celu zaprezentowania rzeczywistego zastosowania jego potężnej AI.
Gang Song of Alibaba Inteligentne Information Group dla ludzi i uszy, stwierdzając: „Szklanki AI staną się najważniejszą formą inteligencji noszenia-będzie służyć jako inna para oczu i uszy”. Udowadniając światowej klasy możliwości sztucznej inteligencji tuż przed odsłonięciem sprzętu, Alibaba wykonała „pokaz, nie mów” strategii budowania zaufania na rynku.
To zintegrowane pozycje sprzętu i oprogramowania jest Alibaba do konkurowania nie tylko w zakresie wydajności modelu, ale także o tworzeniu bezproblemowego doświadczenia użytkownika w ramach ogromnej ekusystu.