Pekingissä toimiva Moonshot AI julkaisi perjantaina Kimi K2: n, avoimen lähdekoodin AI-mallisarjan, jonka tarkoituksena on palauttaa markkinajohtajuus Kiinan kilpailukykyisessä AI-alalla. Käynnistys on strateginen siirto haastamaan kilpailijoita, kuten Deepseek ja kilpailevat maailmanlaajuisesti yhdysvaltalaisten yritysten kanssa.
Kimi K2 on massiivinen eksperttien seoksen malli, jolla on 1 biljoonaa parametria. Se on erityisesti suunniteltu”agentilliseen älykkyyteen”, jolloin se voi suorittaa itsenäisesti monimutkaisia tehtäviä ja käyttää digitaalisia työkaluja. Moonshot korostaa Kimi K2: n kykyä toimia, ei vain keskustella, sijoittamalla se tehokas uusi työkalu kehittäjille . Tsinghua-yliopiston tutkinnon suorittanut Yang Zhilin perusti vuonna 2023 Moonshot AI: n nopeasti, mutta paikallisten kilpailijoiden aggressiiviset muutokset ovat äskettäin haastaneet sen markkinat. Tämä lanseeraus on suora ja voimakas vastaus.
Strateginen gambit Kiinan kovissa AI-sodassa
Moonshotin Kimi-sovelluksen käyttäjäkunta näki sen sijoitusluvun kolmannesta seitsemänteen Kiinassa elokuun 2024 ja kesäkuun 2025 välisenä aikana. Tämä taantuminen seurasi haitta-alhaisten mallejen häiriöitä. Kimi K2-julkaisu on selkeä tarjous tämän suuntauksen kääntämisestä.
avoimella lippulaivamallillaan Moonshot ottaa käyttöön strategian, jota kiinalaiset teknologiayritykset suosittelevat yhä enemmän. Tämä lähestymistapa auttaa rakentamaan laajaa kehittäjäyhteisöä ja laajentaa globaalia vaikutusta, ja se toimii tehokkaana vastatoimenpiteenä Yhdysvaltain teknologiarajoituksiin. Se on Gambit voittaa sydämet ja mielet koodin kautta. Tämän siirron tavoitteena on palauttaa Kimi uudelleen kehittäjille go-to-alustaksi, vedonlyönti, että tämä parempi kyky ja avoin ekosysteemi voivat voittaa markkinaosuuden.
vertailuarvojen suorituskyky-ja kilpailukykyinen asema
Mooonshot AI: n ja AIMI-K2-ANSTRUCT-mallin vastaisten suorituskykytietojen mukaan ALE: n aloitusmallien kanssa. tehtävät. Tulokset osoittavat kilpailukykyisen suorituskyvyn useilla avainalueilla, mukaan lukien koodaus, työkalujen käyttö ja monimutkainen päättely.
koodausvertailuarvoissa Kimi K2 saavutti 53,7 pisteet 53,7: llä Livecodebench V6: lla, verrattuna 47,4 Claude Opus 4: lle ja 44,7: lle GPT-4,1: lle. Agentisen koodauskokeen Swe-Bench todensi, että sen yksitoimitus oli 65,8%, sijoittaen sen Deepseek-V3: n 38,8%: n ja GPT-4,1: n 54,6%: n yläpuolelle, kun taas Claude Sonnet 4: n pisteet 72,7%. TAU2-televiestinnän tehtävässä Kimi K2 sai 65,8, mikä oli korkeampi kuin GPT-4,1: n (38,6) ja Claude Sonnet 4: n (45,2) ilmoitetut pisteet. Tämä viittaa siihen, että Kimi K2 osoitti vahvoja tuloksia vahvojen tulosten saavuttamiseksi voimakkaasti ulkoisten työkalujen kanssa.
matematiikkaa ja päättelyä varten. AIME 2024 Math-kilpailun vertailuarvossa sen pisteet 69,6 oli korkeampi kuin Gemini 2,5 Flash (61,3) ja Claude Opus 4 (48,2). Samoin GPQA-Diamond-päättelytestissä sen pistemäärä 75,1 ylitti hiukan Claude Opus 4: n 74,9. Tämä asettaa sen tiiviisti kilpailuun muiden rajamallien kanssa, GPT-4.1-pisteytys 90.4 ja Claude Opus 4 saavuttaa 92,9. Yhdessä tiedot viittaavat siihen, että Kimi K2 on erittäin kykenevä malli, etenkin avoimen lähdekoodin luokassa.
konepellin alla: triljoonan parametriagentti, joka on rakennettu toimintaan
kimi k2is-parametrien kokonaisparametrien kanssa (moe)
kimi k2. href=”https://moonshotai.github.io/kimi-k2/”Target=”_ tyhjä”> 32 miljardia aktivoidaan jokaiselle annetulle tunnukselle . Tämä arkkitehtuuri, joka on samanlainen kuin kilpaileva Deepseek-V3, on suunniteltu laskennalliseen tehokkuuteen massiivisessa mittakaavassa, joka on käytännön käyttöönoton avaintekijä. Siinä on 384 erillistä asiantuntijaa, joista kahdeksan valitaan käsittelemään jokaista merkkiä, mikä mahdollistaa erittäin erikoistuneen ja tehokkaan laskennan. Tämä malli on seurausta skaalauslaki-analyysistä, jonka tavoitteena on maksimoida merkkitehokkuus.
Malli kouluttiin ennalta 15,5 biljoonan datan merkinnöillä. Tämän prosessin hallitsemiseksi ilman epäonnistumista Moonshot kehitti uuden “MuonClip”-optimoijan. Tämä tekniikka on evoluutio sen Aikaisempi työ muon-optimoijalla , joka ylittää tavanomaisen adamw-optimoijan, mutta Can kärsii epävakaudesta. Huomioloki”, jotka voivat ohittaa suuren mittakaavan mallin kehittämisen. Yhtiö raportoi, että tämä menetelmä antoi sille mahdollisuuden suorittaa koko 15,5T-tunnuskoulutus “nollaharjoittelupihalla”, korostaen sen kestävyyttä.
Ydinarkkitehtuurin ulkopuolella Kimi K2: n agentiset kyvyt hiottiin hienostuneen datasynteesin putkilinjan kautta. Tämä järjestelmä simuloi reaalimaailman skenaarioita, joissa on tuhansia työkaluja, mukaan lukien mallit-kontekstiprotokollan (MCP) kanssa yhteensopivat korkealaatuiset, otsikkopohjaiset koulutustiedot työkalujen käyttöön.
Lisäksi Moonshot käytti “yleistä vahvistusoppimista”-järjestelmää. Tähän sisältyy itsesäätömekanismi, jossa malli toimii omana kriitikkona antaa palautetta tehtävistä, joilla on muuttamaton palkkio, kuten raportin kirjoittaminen, tärkeä askel yleisempien ja luotettavien agenttitaitojen kehittämisessä. Target=”_ tyhjä”> Mallin kahden version vapauttaminen . Kimi-K2-emäs on perusmalli, joka on tarkoitettu tutkijoille, jotka tarvitsevat täydellistä hallintaa hienosäätöön. Kimi-K2-Instruct on posti koulutettu versio, joka on optimoitu chattiin ja jota kuvataan “refleksi-luokan malliksi pitkään ajattelematta”agenttien agenttien tehtäviin.
moonshot tarjoaa pääsyn Kimi K2: een KIMI Chat App Developer API ja Ohjeet self-hosting . Yhtiö huomauttaa, että mallilla on rajoituksia, mukaan lukien satunnaiset suorituskyvyn putoukset, kun työkalujen käyttö on käytössä, numero se aikoo käsitellä . on agentti älykkyys perusteollisuuden siirtymisen jälkeen AI-avustajista, jotka vain ehdottavat tekstiä tai koodia. AI-agentit on suunniteltu ymmärtämään tavoite, luomaan suunnitelma ja käyttämään työkaluja monimutkaisten, monivaiheisten tehtävien suorittamiseen. Maamerkkien liikkeessä sijoituspankki Goldman Sachs aloitti juuri autonomisen AI-kooderin Devinin ohjaamisen. Pankin tavoitteena on rakentaa”hybridityövoima”, jossa sen ihmisinsinöörit valvovat tuhansia AI-agentteja.
Goldmanin tekniikan päällikkö Marco Argenti selitti visiota ja totesi:”Kyse on todella siitä, että ihmiset ja AIS työskentelevät rinnakkain. Insinöörien odotetaan olevan kyky kuvata todella ongelmia yhtenäisissä tavalla ja kääntää”. Työvoimamme Devinin kanssa, joka tulee olemaan kuin uusi työntekijämme, joka alkaa tehdä asioita kehittäjillämme”,”ihmisen keskittymisen ikävästä koodauksesta korkean tason valvontaan.
Tämä suuntaus ei rajoitu rahoitukseen. Laajemmat AI-koodausmarkkinat ovat taistelukenttä, jossa Google käynnistää Jules-agentinsa ja Free Gemini CLI: n. Openai antoi Codex-agentin Internet-yhteyden, vaikka toimitusjohtaja Sam Altman varoitti käyttäjiä”lukemaan risistä huolellisesti ja käyttämään, kun se on järkevää”, tunnustaen luontaiset riskit. AnySphere, suositun kohdistimen AI-editorin valmistaja, julkaisi äskettäin verkkosovelluksen hallitakseen koodausagentteja mistä tahansa laitteesta. Tämän”monen pinnan”strategian tavoitteena on tehdä AI: sta ympäristön, aina läsnä olevan yhteistyökumppanin.