Moonshot AI me bazë në Pekin lëshoi ​​Kimi K2 të Premten, një seri modelesh me burim të hapur AI që synon të rimarrë udhëheqjen e tregut në sektorin konkurrues të AI të Kinës. Nisja është një veprim strategjik për të sfiduar rivalët si Deepseek dhe të garojë globalisht me firmat amerikane. Isshtë krijuar posaçërisht për”inteligjencën agjentike”, duke e lejuar atë të ekzekutojë në mënyrë autonome detyra komplekse dhe të përdorë mjete dixhitale. Moonshot thekson aftësinë e Kimi K2 për të vepruar, jo vetëm të bisedojë, duke e pozicionuar atë si një mjetin e ri të fuqishëm për zhvilluesit . E themeluar në vitin 2023 nga i diplomuari i Universitetit Tsinghua Yang Zhilin, AI Moonshot shpejt fitoi rëndësi, por qëndrimi i tij në treg kohët e fundit është sfiduar nga lëvizjet agresive nga konkurrentët vendas. Kjo nisje është një përgjigje e drejtpërdrejtë dhe e fuqishme. src=”të dhëna: imazh/svg+xml; nitro-empty-id=mty0ntoxmti3-1; base64, phn2zyb2awv3qm94psiwidagmti4mca3mj AiiHdpZHropsixmjgwiibozwlnahq9iJCymcigEg1Sbnm9imH0dha6ly93d3cudzmUB3JnlziWmdavc3znij48l3n2zz4=”>

Një gambit strategjik në Luftërat e Fierce AI të Kinës

Baza e përdoruesve të Moonshot për aplikacionin e saj Kimi pati renditjen e saj nga e treta në të shtatin në Kinë midis gushtit 2024 dhe qershorit 2025. Kjo rënie pasoi lëshimin përçarës të modeleve me kosto të ulët nga rivalja Deepseek, e cila intensifikoi çmimin e shtëpisë së shtëpisë dhe performancën e performancës. Lëshimi i Kimi K2 është një përpjekje e qartë për ta kthyer këtë prirje. Kjo qasje ndihmon në ndërtimin e një komuniteti të gjerë të zhvilluesve dhe të zgjerojë ndikimin global, duke shërbyer si një kundërmas i fuqishëm për kufizimet e teknologjisë amerikane. Ashtë një gambit për të fituar zemrat dhe mendjet përmes kodit. Kjo veprim synon të rivendosë Kimi si një platformë për zhvilluesit, bastet që aftësia superiore dhe një ekosistem i hapur mund të fitojnë pjesën e tregut. Rezultatet tregojnë performancën konkurruese në disa fusha kryesore, duke përfshirë kodimin, përdorimin e mjeteve dhe arsyetimin kompleks. Në provën e kodimit agjent SWE-Bench të verifikuar, saktësia e tij me një kontekst të vetëm ishte 65.8%, duke e vendosur atë mbi 38.8%të Deepseek-V3 dhe 54.6%të GPT-4.1, ndërsa gjurmimi i Claude Sonnet 4 prej 72.7%. Në detyrën e telekomit Tau2, Kimi K2 shënoi 65.8, i cili ishte më i lartë se rezultatet e raportuara për GPT-4.1 (38.6) dhe Claude Sonnet 4 (45.2). Kjo sugjeron një aftësi të fortë për ndërlidhjen me mjete të jashtme për të përfunduar objektivat.

Për matematikë dhe arsyetim, Kimi K2 gjithashtu demonstroi rezultate të forta. Në standardin e konkursit të matematikës AIME 2024, rezultati i tij prej 69.6 ishte më i lartë se ai i Gemini 2.5 Flash (61.3) dhe Claude Opus 4 (48.2). Në mënyrë të ngjashme, në testin e arsyetimit të GPQA-Diamond, rezultati i tij prej 75.1 pak tejkaloi Claude Opus 4 74.9. Kjo e vendos atë në konkurrencë të ngushtë me modele të tjera kufitare, me GPT-4.1 duke shënuar 90.4 dhe Claude Opus 4 duke arritur 92.9. Në mënyrë kolektive, të dhënat sugjerojnë që Kimi K2 është një model shumë i aftë, veçanërisht në kategorinë me burim të hapur. href=”https://moonshotai.github.io/kimi-k2/”target=”_ bosh”> 32 miliardë aktivizohen për çdo shenjë të dhënë . Kjo arkitekturë, e ngjashme me atë të përdorur nga rivali Deepseek-V3, është krijuar për efikasitet llogaritës në shkallë masive, një faktor kryesor për vendosjen praktike. Ajo përmban 384 ekspertë të veçantë, me tetë të zgjedhur për të përpunuar çdo shenjë, duke lejuar llogaritjen shumë të specializuar dhe efikas. Ky dizajn është një rezultat i analizës së shkallëzimit të ligjit që synon maksimizimin e efikasitetit të shenjës. Për të menaxhuar këtë proces pa dështim, Moonshot zhvilloi një roman”Muonclip”Optimizer. Kjo teknikë është një evolucion i saj Puna e hershme në optimizuesin e muonit , i cili tejkalon standardin e optimizmit, por mund të vuajë nga paqëndrueshmëria në shkallë. logjet”që mund të prishin zhvillimin e modelit në shkallë të gjerë. Kompania raporton se kjo metodë e lejoi atë të përfundojë të gjithë trainimin 15.5t të shenjës me”Zero Training Spike”, duke theksuar qëndrueshmërinë e saj. Ky sistem simulon skenarë të botës reale me mijëra mjete, duke përfshirë ato të pajtueshme me Protokollin e Kontekstit të Modelit (MCP), për të gjeneruar të dhëna trajnimi me cilësi të lartë, me bazë rubrikën për përdorim të mjeteve. Kjo përfshin një mekanizëm vetë-gjykues ku modeli vepron si kritik i tij për të siguruar reagime mbi detyrat me shpërblime jo të verifikueshme, të tilla si shkrimi i një raporti, një hap thelbësor në zhvillimin e aftësive më të përgjithshme dhe të besueshme të agjentit. versionet e modelit . Kimi-K2-Baza është modeli themelor, i destinuar për studiuesit që kanë nevojë për kontroll të plotë për rregullimin e mirë. Kimi-k2-instrukt është një version i trajnuar pas i optimizuar për bisedë dhe përshkruhet si një model i shkallës refleksi pa mendime të gjata”për detyrat e agjentit jashtë kutisë. href=”https://platform.moonshot.ai/”target=”_ bosh”> API zhvilluesi , dhe Udhëzimet për vetë-hosting”. Kompania vëren në mënyrë transparente modeli ka kufizime, duke përfshirë rëniet e rastit të performancës kur përdorimi i mjeteve është aktivizuar, një . Inteligjenca agjentike pas zhvendosjes së industrisë themelore larg nga asistentët e AI që thjesht sugjerojnë tekst ose kod. Agjentët e AI janë krijuar për të kuptuar një qëllim, për të krijuar një plan dhe për të përdorur mjete për të ekzekutuar detyra komplekse, me shumë hapa. Në një veprim historik, banka e investimeve Goldman Sachs sapo filloi të pilotojë koduesin autonome të AI Devin. Banka synon të ndërtojë një”forcë punëtore hibride”ku inxhinierët e saj njerëzorë mbikëqyrin mijëra agjentë të AI. Fuqia jonë punëtore me Devin, e cila do të jetë si punonjësi ynë i ri i cili do të fillojë të bëjë gjëra në emër të zhvilluesve tanë,”duke zhvendosur përqendrimin njerëzor nga kodimi i lodhshëm në mbikëqyrje të nivelit të lartë.

Ky trend nuk është i kufizuar në financa. Tregu më i gjerë i kodimit të AI është një fushë beteje, me Google duke nisur Agjentin e tij Jules dhe Free Gemini CLI. Openai i dha Agjentit të saj Codex Access Internet, megjithëse CEO Sam Altman paralajmëroi përdoruesit e”lexuar në lidhje me rreziqet me kujdes dhe përdorin kur ka kuptim”, duke pranuar rreziqet e qenësishme. AnySphere, prodhues i redaktorit popullor të kursorit AI, kohët e fundit nisi një aplikacion në internet për të menaxhuar agjentët e tij të kodimit nga çdo pajisje. Kjo strategji”shumë-sipërfaqësore”synon ta bëjë AI një bashkëpunëtor ambienti, gjithnjë të pranishëm.