Sa linggong ito, ang koponan ng QWEN ng Alibaba ay naglabas ng isang bagong modelo ng open-source na pangangatuwiran na modelo na nanginginig sa industriya ng AI. Naipalabas noong Hulyo 25, ang modelo ng QWEN3-235B-A22B-Thinking-2507 ay nanguna sa mga pangunahing benchmark ng industriya, na nagpapalaki ng mga makapangyarihang sistema ng pagmamay-ari mula sa mga karibal tulad ng Google at OpenAI. Inaalis nito ang nakaraang”Hybrid Thinking”na diskarte upang sanayin ang hiwalay, dalubhasang mga modelo para sa kumplikadong pangangatuwiran at mabilis na pagsunod sa pagtuturo. Ang hakbang na ito ay naglalayong maihatid ang mas mataas na kalidad at magbigay ng mga developer ng mga tool ng state-of-the-art na AI. mga system. Ang pagganap nito ay hindi nakakulong sa isang solong angkop na lugar; Sa halip, nagpapakita ito ng isang mahusay na bilog at malakas na kakayahan sa kumplikadong pangangatuwiran, coding, at pagkakahanay ng gumagamit, na nagtatakda ng isang bagong pamantayan para sa kung ano ang maaaring makamit ng bukas na mapagkukunan ng AI. src=”data: imahe/svg+xml; nitro-empty-id=mtyzodoxmtc2-1; base64, phn2zyb2awv3qm94psiwidagmti4mca3mj Aiihdpzhropsixmjgwiibozwlnahq9ijCyMcigeg1Sbnm9imh0dha6ly93d3cudzmub3jnlziwmdavc3znij48l3n2zz4=”>

Sa kaharian ng advanced na matematika at lohikal na pangangatuwiran, ang modelo ay napatunayan na may kakayahang may kakayahang. Sa benchmark ng AIE25, isang pagsubok na idinisenyo upang masuri ang sopistikadong, maraming mga kasanayan sa paglutas ng problema, nakamit ng QWEN3-pag-iisip-2507 ang isang kamangha-manghang iskor na 92.3. Inilalagay nito ang ilan sa mga pinakamalakas na modelo ng pagmamay-ari, lalo na ang paglampas sa Gemini-7.5 Pro ng Google, na nag-post ng marka na 88.0 sa parehong pagsusuri. Kapag nasubok sa LiveCodebench V6, isang benchmark na tinatasa ang kakayahan ng AI na hawakan ang mga gawain sa pag-cod ng real-world, ang pag-iisip ng QWEN3 ay nakakuha ng isang nangungunang marka ng 74.1. Ang pagganap na ito ay inilalagay ito nang kumportable sa unahan ng parehong Gemini-7.5 Pro (72.5) at OpenAi’s O4-Mini (71.8), na nagpapakita ng praktikal na utility para sa mga developer at engineering team. Kinuha ang tuktok na lugar sa benchmark ng arena-hard V2, na sinusukat kung aling mga gumagamit ng mga gumagamit ang ginusto sa mga paghahambing sa head-to-head. Ang nangungunang marka na 79.7 ay nagpapahiwatig hindi lamang malakas na kasanayan sa teknikal kundi pati na rin isang mataas na antas ng pagiging kapaki-pakinabang, pagkakaisa, at kaligtasan sa mga nabuong tugon nito. Nangangatuwiran Inihayag ng kumpanya na ito ay opisyal na tinalikuran ang mode na”Hybrid Thinking”na isang pangunahing tampok ng mga naunang modelo ng QWEN3. Ang paunang diskarte na iyon ay nangangailangan ng mga developer na manu-manong i-toggle sa pagitan ng mabilis na pagsunod sa pagtuturo at malalim na mga mode ng pangangatuwiran gamit ang mga espesyal na token, isang sistema na maaaring magpakilala ng pagiging kumplikado at hindi pagkakapare-pareho. Sa isang pormal na pahayag, Ang bagay na ito, napagpasyahan naming iwanan ang mode ng pag-iisip ng hybrid. Ang mga”tagubilin”na mga modelo ay maaaring maayos para sa bilis at walang kamali-mali na pagpapatupad ng mga direktang utos, habang ang mga modelo ng”pag-iisip”ay maaaring sanayin nang eksklusibo sa kumplikado, maraming hakbang na pangangatuwiran na mga gawain. Nagreresulta ito sa pinabuting pare-pareho, higit na kalinawan para sa mga nag-develop, at sa huli, ang higit na mahusay na pagganap ng benchmark na ipinakita ng bagong paglabas na ito. Habang ang modelo ay naglalaman ng isang napakalaking 235 bilyong kabuuang mga parameter, na nagbibigay nito ng isang napakalawak na repositoryo ng kaalaman, isinaaktibo lamang nito ang isang sandalan na 22-bilyong-parameter na subset para sa anumang naibigay na gawain.

Karagdagang pagpapahusay ng mga kakayahan nito, ang modelo ay nag-aalok ng isang malaking 262,144-token na window ng konteksto, na kumakatawan sa isang makabuluhang pagtaas mula sa mga nakaraang bersyon at isang kritikal na tampok para sa mga advanced na aplikasyon ng negosyo. Ang malawak na kapasidad na ito ay nagbibigay-daan sa modelo na maproseso at mangangatuwiran sa napakalaking halaga ng impormasyon sa isang solong pass, tulad ng pagsusuri ng buong pag-alaala ng software code, kumplikadong mga pakikipag-ugnayan ng gumagamit nang hindi nawawala ang thread ng pag-uusap. Ang pinaka makabuluhang aspeto ng paglabas ay ang paglilisensya nito. Qwen3-pag-iisip-2507 ay magagamit sa ilalim ng lisensya ng Apache 2.0 , isang lubos na pinahihintulutan at komersyal na kasunduan. Pinapayagan nito ang mga organisasyon na malayang mag-download, magbago, at mag-deploy ng modelo. Nagbibigay ito ng buong kontrol sa kanilang privacy ng data, seguridad, gastos, at latency, pagtugon sa mga pangunahing alalahanin para sa mga negosyo na nagpapatakbo sa mga regulated na industriya o may sensitibong impormasyon. Ang Ang pagpepresyo ay nakatakda sa $ 0.70 bawat milyong mga token ng input at $ 8.40 bawat milyong output tokens , na may isang libreng tier para sa mga nag-develop na mag-eksperimento. href=”https://openrouter.ai/models/qwen/qwen3-235b-a22b-think-2507″target=”_ blangko”> pag-access sa modelo sa pamamagitan ng mga platform tulad ng openRouter . Ito ay katugma sa pagsasama ng mga ahente ng kumplikado, awtomatikong workflows na nangangailangan ng paggamit at tool. Glasses

Ang modelo ng Qwen3-Kamakailan lamang ay inilunsad ng koponan ng QWEN ang isang bagong napakalaking 480B-parameter na modelo ng coder, at isang modelo ng pagsasalin ng multilingual, na nagtatayo ng isang komprehensibong open-source AI ecosystem. Ang diskarte ay lilitaw na isa sa pagbibigay ng isang buong suite ng malakas, bukas na mga tool para sa mga developer.

Ang tiyempo ng paglabas na ito ay malinaw na madiskarteng. Dumating lamang ito isang araw bago na-preview ng Alibaba ang bagong”Quark AI”na matalinong baso sa World Artipisyal na Kumperensya ng Intelligence sa Shanghai. Ang mga baso ay pinalakas ng bagong serye ng QWEN3, isang hakbang na idinisenyo upang ipakita ang real-world application ng malakas na AI. Sa pamamagitan ng pagpapatunay ng mga kakayahan sa buong mundo na AI bago pa mailabas ang hardware, isinagawa ng Alibaba ang isang”palabas, huwag sabihin”na diskarte upang makabuo ng kumpiyansa sa merkado.