Ang Beijing na nakabase sa Beijing ay pinakawalan ang Kimi K2 noong Biyernes, isang serye ng open-source na modelo ng AI na naglalayong makuha ang pamunuan ng merkado sa mapagkumpitensyang sektor ng AI. Ang paglulunsad ay isang madiskarteng paglipat upang hamunin ang mga karibal tulad ng Deepseek at makipagkumpetensya sa buong mundo sa mga kumpanya ng Estados Unidos. Ito ay partikular na idinisenyo para sa”intelligence intelligence,”na nagpapahintulot sa ito na awtonomously isakatuparan ang mga kumplikadong gawain at gumamit ng mga digital na tool. Binibigyang diin ni Moonshot ang kakayahan ni Kimi K2 na kumilos, hindi lamang makipag-chat, pagpoposisyon nito bilang isang malakas na bagong tool para sa mga developer . Itinatag noong 2023 ng graduate ng Tsinghua University na si Yang Zhilin, ang Moonshot AI ay mabilis na nakakuha ng katanyagan, ngunit ang nakatayo sa merkado nito ay kamakailan lamang ay hinamon ng mga agresibong galaw mula sa mga lokal na kakumpitensya. Ang paglulunsad na ito ay isang direkta at malakas na tugon.

isang madiskarteng sugal sa mabangis na AI Wars ng Tsina Ang paglabas ng Kimi K2 ay isang malinaw na bid upang baligtarin ang kalakaran na ito. Ang pamamaraang ito ay tumutulong sa pagbuo ng isang malawak na komunidad ng developer at nagpapalawak ng pandaigdigang impluwensya, na nagsisilbing isang malakas na countermeasure sa mga paghihigpit sa teknolohiya ng Estados Unidos. Ito ay isang sugal upang manalo ng mga puso at isipan sa pamamagitan ng code. Ang hakbang na ito ay naglalayong muling maitaguyod ang Kimi bilang isang go-to platform para sa mga nag-develop, na ang pagtaya na ang higit na mahusay na kakayahan at isang bukas na ekosistema ay maaaring manalo ng pagbabahagi sa merkado. Ang mga resulta ay nagpapahiwatig ng mapagkumpitensyang pagganap sa ilang mga pangunahing lugar, kabilang ang coding, paggamit ng tool, at kumplikadong pangangatuwiran. Sa pag-verify ng ahente ng coding ng ahente, ang katumpakan ng pag-iingat na ito ay 65.8%, na inilalagay ito sa itaas ng 38.8%ng Deepseek-V3 at GPT-4.1’s 54.6%, habang ang marka ng Claude Sonnet 4 na 72.7%. Sa gawain ng TAU2 Telecom, si Kimi K2 ay umiskor ng 65.8, na mas mataas kaysa sa naiulat na mga marka para sa GPT-4.1 (38.6) at Claude Sonnet 4 (45.2). Ito ay nagmumungkahi ng isang malakas na kakayahan para sa pakikipag-ugnay sa mga panlabas na tool upang makumpleto ang mga layunin. Sa benchmark ng Aime 2024 Math Competition, ang marka nito na 69.6 ay mas mataas kaysa sa Gemini 2.5 flash (61.3) at Claude Opus 4 (48.2). Katulad nito, sa pagsubok ng pangangatuwiran ng GPQA-Diamond, ang marka nito na 75.1 ay bahagyang lumampas sa Claude Opus 4’s 74.9. Inilalagay nito ito sa malapit na kumpetisyon sa iba pang mga modelo ng Frontier, na may GPT-4.1 na pagmamarka ng 90.4 at Claude Opus 4 na nakamit ang 92.9. Sama-sama, iminumungkahi ng data na ang Kimi K2 ay isang lubos na may kakayahang modelo, lalo na sa kategoryang bukas na mapagkukunan. href=”https://moonshotai.github.io/kimi-k2/”target=”_ blangko”> 32 bilyon ay isinaaktibo para sa anumang naibigay na token . Ang arkitektura na ito, na katulad ng ginamit ng karibal na Deepseek-V3, ay idinisenyo para sa computational na kahusayan sa napakalaking scale, isang pangunahing kadahilanan para sa praktikal na paglawak. Nagtatampok ito ng 384 natatanging mga eksperto, na may walong napili upang maproseso ang bawat token, na nagpapahintulot para sa lubos na dalubhasa at mahusay na pagkalkula. Ang disenyo na ito ay isang resulta ng pagsusuri ng scaling-law na naglalayong ma-maximize ang kahusayan ng token. Upang pamahalaan ang prosesong ito nang walang pagkabigo, binuo ng Moonshot ang isang nobelang”Muonclip”optimizer. Ang pamamaraan na ito ay isang ebolusyon ng mas maaga na gumana sa muon optimizer Mga logits”na maaaring mag-derail ng malakihang pag-unlad ng modelo. Iniulat ng kumpanya na ang pamamaraang ito ay pinapayagan ito upang makumpleto ang buong 15.5T token training run na may”zero training spike,”na itinampok ang katatagan nito. Ang sistemang ito ay ginagaya ang mga senaryo ng real-world na may libu-libong mga tool, kabilang ang mga katugma sa Model Context Protocol (MCP), upang makabuo ng mataas na kalidad, data ng pagsasanay na batay sa rubric para sa paggamit ng tool. Ito ay nagsasangkot ng isang mekanismo sa paghuhusga sa sarili kung saan ang modelo ay kumikilos bilang sariling kritiko upang magbigay ng puna sa mga gawain na may hindi masasabing mga gantimpala, tulad ng pagsulat ng isang ulat, isang mahalagang hakbang sa pagbuo ng mas pangkalahatan at maaasahang mga kasanayan sa ahente. Mga Bersyon ng Model . Ang Kimi-K2-Base ay ang modelo ng pundasyon, na inilaan para sa mga mananaliksik na nangangailangan ng buong kontrol para sa pinong pag-tune. Ang Kimi-K2-Instruct ay isang post-sanay na bersyon na na-optimize para sa chat at inilarawan bilang isang”reflex-grade model nang walang matagal na pag-iisip”para sa mga kimi k2 sa pamamagitan ng developer api , at isyu na plano nitong tugunan . Ang katalinuhan ng ahente na sumusunod sa pangunahing industriya ay lumilipat sa mga katulong sa AI na nagmumungkahi lamang ng teksto o code. Ang mga ahente ng AI ay idinisenyo upang maunawaan ang isang layunin, lumikha ng isang plano, at gumamit ng mga tool upang maisagawa ang kumplikado, maraming hakbang na gawain. Sa isang landmark na paglipat, ang bangko ng pamumuhunan na si Goldman Sachs ay nagsimulang mag-piloto ng autonomous AI coder na si Devin. Nilalayon ng bangko na bumuo ng isang”hybrid workforce”kung saan pinangangasiwaan ng mga inhinyero ng tao ang libu-libong mga ahente ng AI. Ang manggagawa kasama si Devin, na magiging katulad ng aming bagong empleyado na magsisimulang gumawa ng mga bagay-bagay sa ngalan ng ating mga nag-develop,”paglilipat ng pokus ng tao mula sa nakakapagod na pag-cod hanggang sa mataas na antas ng pangangasiwa.

Ang kalakaran na ito ay hindi limitado sa pananalapi. Ang mas malawak na merkado ng coding ng AI ay isang larangan ng digmaan, kasama ang Google na naglulunsad ng ahente ng Jules at libreng Gemini CLI. Ibinigay ng OpenAI ang pag-access sa codex ahente ng Internet, kahit na binalaan ng CEO na si Sam Altman ang mga gumagamit na”basahin nang mabuti ang mga panganib at gagamitin kapag may katuturan,”kinikilala ang mga likas na panganib. Si Anysphere, tagagawa ng sikat na editor ng Cursor AI, kamakailan ay naglunsad ng isang web app upang pamahalaan ang mga ahente ng coding mula sa anumang aparato. Ang diskarte na”multi-surface”na ito ay naglalayong gawin ang AI na isang ambient, kailanman-kasalukuyang nakikipagtulungan.

Categories: IT Info