Ang koponan ng QWEN ng Alibaba noong Martes ay naglabas ng QWEN3-Coder, isang malakas na bagong serye ng mga open-source na mga modelo ng AI coding na naglalayong direkta sa mga karibal tulad ng Anthropic. Pinuno ng isang napakalaking bersyon ng 480-bilyong-parameter, ang mga modelo ay idinisenyo para sa”ahente”na trabaho, na pinapayagan silang hawakan ang mga kumplikadong gawain sa pag-unlad ng software. Upang magtakda ng isang bagong pamantayan para sa mga bukas na modelo. Gayunpaman, dumating din ang paglulunsad sa gitna ng malalim na pag-aalinlangan sa industriya sa mga benchmark ng AI, na na-fuel sa pamamagitan ng mga kamakailang paratang na ang isa pang mga modelo ng Alibaba ay niloko sa mga pangunahing pagsubok sa pagganap. href=”https://huggingface.co/qwen/qwen3-coder-480b-a35b-instruct”target=”_ blangko”> qwen3-coder-480b-a35b-instruct , isang napakalaking halo-ng-experts (MOE) na modelo. Naglalaman ito ng 480 bilyong kabuuang mga parameter, ngunit isinaaktibo lamang ang isang 35-bilyong-parameter na subset para sa anumang naibigay na gawain. Ang arkitektura na ito ay nagbibigay ng napakalawak na kapangyarihan habang pinapanatili ang kahusayan sa computational.

Ang pundasyon ng modelo ay itinayo sa isang malaking 7.5 trilyon na mga token ng data ng pre-pagsasanay, na may isang 70% na ratio na partikular na nakatuon sa code. Ayon sa koponan ng QWEN, ang kalidad ng data ay pinakamahalaga; Nag-leveraged sila ng isang nakaraang modelo, Qwen2.5-Coder, upang linisin ang synthetically at muling isulat ang maingay na data para sa bagong henerasyong ito. Ipinagmamalaki ng modelo ang isang katutubong 256,000-token na haba ng konteksto, na maaaring mapalawak sa isang milyong mga token gamit ang mga pamamaraan ng extrapolation tulad ng sinulid. Ang malawak na kapasidad na ito ay pinasadya para sa pag-unawa sa scale-scale, na nagpapahintulot sa AI na maunawaan ang buong konteksto ng mga malalaking proyekto ng software. Sinusuportahan ng modelo ang isang malawak na hanay ng mga wika ng programming, mula sa mga pangunahing pagpipilian tulad ng C ++, Python, at Java hanggang sa mga dalubhasang wika tulad ng abap, kalawang, at mabilis, tulad ng detalyado sa

Ang industriya ay mabilis na gumagalaw na lampas sa mga simpleng katulong sa code sa mga autonomous agents na maaaring magplano, magpatupad, at umangkop sa mga kumplikadong, maraming hakbang na mga gawain sa pag-unlad. Ang Qwen3-Coder ay hindi lamang isang bagong modelo; Ito ay isang madiskarteng pagpasok sa ito na tumataas na”arm race.”

Ang takbo ay napatunayan na sa negosyo. Halimbawa, ang pamumuhunan sa bangko na si Goldman Sachs, kamakailan ay nagsimulang mag-piloto sa ahente ng AI na si Devin upang magtayo ng isang”hybrid workforce”. Ang hepe ng tech na ito, si Marco Argenti, ay inilarawan ang isang hinaharap kung saan”ito ay talagang tungkol sa mga tao at AI na nagtatrabaho sa tabi-tabi. Ang mga inhinyero ay inaasahan na magkaroon ng kakayahang talagang ilarawan ang mga problema sa isang magkakaugnay na paraan…”Ang paglilipat ng pokus ng tao mula sa nakakapagod na pag-coding hanggang sa mataas na antas ng paglutas ng problema. Sa Estados Unidos, kamakailan lamang ay inilabas ng Amazon ang ahente ng Kiro na magpataw ng istraktura sa magulong”vibe coding,”habang hinahabol ng Google ang isang dalawang-pronged na pag-atake kasama ang komprehensibong firebase studio at isang libreng Gemini CLI. Patuloy na na-upgrade ng OpenAi ang ahente ng Codex nito, kamakailan na binibigyan ito ng pag-access sa internet upang awtonomously makahanap at gumamit ng data. Ang Qwen3-Coder ay nakaposisyon laban sa mga open-source powerhouse tulad ng Moonshot AI, na kamakailan ay pinakawalan ang 1-trilyon-parameter na Kimi K2 na modelo. Ang domestic rivalry na ito ay na-fueled ng mga geopolitical pressure na pinipilit ang mga kumpanya ng Tsino na magtayo ng mga self-reliant ecosystem. Kamakailan lamang ay nakita ng Coding Startup Windsurf ang Google Poach nito at nangungunang talento, na nag-scutt ng isang lanned openai acquisition at pinapayagan ang karibal na pag-unawa upang makuha ang natitirang kumpanya. Sa isang malinaw na halimbawa ng”Benchmark War,”ang Xai ni Elon Musk ay nag-upa ng mga kontratista na partikular na sanayin ang modelo ng Grok 4 na talunin ang Claude ng Anthropic. Ang napakalawak na mga gastos sa pagpapatakbo ay isang kadahilanan din, tulad ng nakikita kapag ang mga limitasyon ng paggamit ng antropiko para sa mga premium na tagasuskribi nito, na binibigyang diin ang pinansiyal na pilay ng pagbibigay ng mga makapangyarihang serbisyong ito. Ang tiyempo ay awkward para sa Alibaba. Ilang araw na ang nakaraan, noong Hulyo 18, isang pag-aaral mula sa unibersidad ng Fudan na sinasabing ang Qwen2.5 na modelo ay”niloko”sa matematika-500 benchmark . pangangatuwiran. Ang kontrobersya na ito ay nagtatampok ng sistematikong isyu ng kontaminasyon ng data, kung saan ang mga katanungan sa pagsubok ay tumagas sa mga set ng pagsasanay, pag-inflate ng pagganap at paglikha ng isang maling impresyon ng mga tunay na kakayahan ng isang modelo. Ang ilan, tulad ng Lmarena CEO Anastasios Angelopoulos, tingnan ito bilang isang normal na bahagi ng pag-unlad, na nagsasabi,”Ito ay bahagi ng pamantayang daloy ng trabaho ng pagsasanay. Kailangan mong mangolekta ng data upang mapagbuti ang iyong modelo.”Tulad ng nabanggit ng strategist ng AI na si Nate Jones,”Sa sandaling itinakda namin ang pangingibabaw ng leaderboard bilang layunin, peligro namin ang paglikha ng mga modelo na higit sa mga trivial na pagsasanay at flounder kapag nahaharap sa katotohanan.”Ang sentimentong ito ay binibigkas ng mga eksperto tulad ni Sara Hooker, pinuno ng mga cohere lab, na nagtalo na”kapag ang isang leaderboard ay mahalaga sa isang buong ekosistema, ang mga insentibo ay nakahanay para sa mga ito upang maging gamed,”paglikha ng isang panganib ng mga modelo na mahusay sa mga pagsusulit ngunit mahirap sa praktikal na mga gawain. Ang Alibaba ay naglalabas ng isang suite ng mga tool sa tabi ng mga modelo. Inilunsad ng kumpanya ang”Qwen Code,”isang interface ng command-line na tinidor mula sa Gemini CLI ng Google at na-customize para sa mga bagong modelo. Nagbibigay ito ng mga developer ng isang handa na kapaligiran para sa ahente ng coding. Kapansin-pansin, ang Qwen3-Coder ang sariling modelo ng studio API , ang alibaba ay pagtaya sa utility at kadalian ng paggamit ay magmaneho sa pag-aampon sa isang hindi nag-iisang panahon ng vendor lock-in. Qwen3-235b-a22b-instruct-2507, na Nagpapakita ng makabuluhang pagpapabuti ng benchmark . Ang dalawahang pagpapalaya na ito ay binibigyang diin ang komprehensibong diskarte ng Alibaba upang makipagkumpetensya sa lahat ng mga harapan ng pandaigdigang lahi ng AI Arms.

Categories: IT Info