Moonshot AI brengt Kimi K2-denkend open-source AI-model uit, gebouwd voor complex redeneren

Het Chinese AI-bedrijf Moonshot AI heeft een nieuw open-sourcemodel genaamd Kimi K2 Thinking. Het werd op 6 november gelanceerd vanuit de basis in Peking en markeert een belangrijke stap in de mondiale race om AI te bouwen die op zichzelf kan handelen.

Het model is een’denkende agent’. Het kan moeilijke problemen oplossen door digitale hulpmiddelen in honderden stappen te gebruiken. Moonshot wil zijn rivalen verslaan in de moeilijke Chinese AI-markt.

In navolging van de Kimi K2-en de Kimi K2 Turbo-modellen met biljoen parameters, richt deze nieuwe versie zich op redeneren op hoog niveau en heeft topscores in industriële tests.

Een ‘Thinking Agent’ gebouwd voor complex redeneren en gebruik van hulpmiddelen

Vanuit het hoofdkantoor in Beijing speelt Moonshot AI opnieuw agressief in de AI-sector.

Het bedrijf heeft Kimi K2 Thinking niet alleen gepositioneerd als een upgrade, maar als een nieuwe modelklasse gericht op autonome uitvoering. Het is ontworpen als een’denkende agent’die in staat is om stap voor stap te redeneren om complexe problemen op te lossen.

Een belangrijke mogelijkheid die door het bedrijf wordt benadrukt, is het vermogen om tussen de 200 en 300 opeenvolgende toolaanroepen uit te voeren, waardoor het ingewikkelde, uit meerdere fasen bestaande taken kan voltooien zonder menselijke tussenkomst.

In tegenstelling tot zijn voorganger, Kimi K2 Turbo, die zich concentreerde op pure snelheid, geeft deze nieuwe release prioriteit aan cognitieve diepgang. De onderliggende architectuur blijft een gigantisch Mixture-of-Experts (MoE)-model met één biljoen parameters, dat 32 miljard parameters activeert voor een bepaald token.

Volgens de officiële modelkaart beschikt het over een uitgebreide contextlengte van 256K. Dankzij dit enorme venster kan het volledige codebases of honderden pagina’s met documenten in één keer verwerken en analyseren, een cruciale functie voor complexe bedrijfstaken.

Een belangrijke technische innovatie is de native INT4-kwantisering, bereikt via een methode genaamd Quantization-Aware Training (QAT). Hierdoor kan het model worden uitgevoerd met berekeningen met lagere precisie, waardoor de inferentiesnelheid effectief wordt verdubbeld, terwijl de prestaties van zijn tegenhangers met hogere precisie behouden blijven.

Voor ontwikkelaars maakt dit het inzetten van een model met biljoen parameters rekenkundig haalbaarder en kosteneffectiever, waardoor een grote drempel voor acceptatie wordt verlaagd.

Moonshot meldt dat Kimi K2 Thinking 44,9 scoorde op Humanity’s Last Exam (met tools), een test van kennis op expertniveau. Bij agentische zoek-en browsetaken zoals BrowseComp scoorde het een score van 60,2, en bij de agentische coderingstest SWE-Bench Verified behaalde het een score van 71,3. (zie de volledige benchmarktabel aan het einde)

Deze resultaten plaatsen het aan de grens van open-sourcemodellen die zijn ontworpen voor agentische capaciteiten.

Een strategische gok in China’s hevige AI-oorlogen

Het vrijgeven van Kimi K2 Denken is een berekende zet in de hypercompetitieve AI-markt van China, vaak de”oorlog van honderd modellen”genoemd.

Moonshot AI, ooit een rijzende ster, heeft te maken gehad met intense druk van binnenlandse rivalen als DeepSeek, Z.ai en Alibaba. Dit nieuwe model is een directe poging om leiderschap terug te winnen door de concurrentiefocus te verleggen van snelheid en prijs naar verfijnd redeneren en agentische prestaties.

Deze omslag komt na een uitdagende periode voor het bedrijf. Het oorspronkelijke Kimi K2-model, gelanceerd in juli, was een gedurfd open source-spel.

De markt raakte echter snel verzadigd met goedkope alternatieven, vooral van concurrent DeepSeek, wat een hevige prijzenoorlog veroorzaakte. Dit had directe gevolgen voor de gebruikersbasis van Moonshot’s Kimi-chatapplicatie, die zijn binnenlandse ranking zag dalen.

Nieuwe gegevens voor oktober 2025 van Statcounter bevestigt de hevige concurrentie, waaruit blijkt dat Moonshot momenteel niet tot de best gerangschikte AI-chatbotproviders in China behoort.

Moonshot gokt erop dat superieure capaciteiten op het opkomende gebied van agentische AI een beter verdedigbare marktpositie kunnen opbouwen dan alleen op kosten concurreren. Deze intense focus op de prestaties van het klassement brengt echter zijn eigen risico’s met zich mee.

Zoals AI-strateeg Nate Jones eerder opmerkte:”op het moment dat we dominantie op het klassement als doel stellen, lopen we het risico modellen te creëren die uitblinken in triviale oefeningen en botsen als we de realiteit onder ogen zien.”Moonshot wil bewijzen dat zijn benchmarkwinst zich vertaalt in het praktische nut dat nodig is om marktaandeel terug te winnen.

[embedded content]

De mondiale race om agentische suprematie

De nieuwste poging van Moonshot maakt deel uit van een fundamentele wereldwijde verschuiving in de AI-industrie. Bedrijven gaan verder dan chatbots die eenvoudigweg tekst-of codesuggesties genereren.

De nieuwe grens is agentische intelligentie: het creëren van autonome systemen die een doel op hoog niveau kunnen begrijpen, een plan kunnen formuleren en een verscheidenheid aan digitale hulpmiddelen kunnen gebruiken om dit uit te voeren. Kimi K2 Thinking is expliciet ontworpen om in deze arena te concurreren.

De waarde van deze agentische aanpak wordt al bewezen in de bedrijfswereld. In een baanbrekende stap begon investeringsbank Goldman Sachs met het testen van de autonome AI-codeur Devin om een ‘hybride personeelsbestand’ te creëren. De visie van het bedrijf is dat menselijke ingenieurs toezicht houden op een vloot AI-agenten, waardoor de aard van softwareontwikkeling wordt getransformeerd.

Goldman’s technisch hoofd, Marco Argenti, legde de strategie uit en zei:”Het gaat eigenlijk om mensen en AI’s die zij aan zij werken. Van ingenieurs wordt verwacht dat ze het vermogen hebben om problemen echt op een coherente manier te beschrijven en deze in aanwijzingen om te zetten…”

Een dergelijke verschuiving weerspiegelt een toekomst waarin de primaire menselijke vaardigheid niet een saaie uitvoering is, maar een hoog niveau probleemdefinitie en toezicht.

Door een model te bouwen dat uitblinkt in complex, uit meerdere stappen bestaand gereedschapsgebruik, positioneert Moonshot AI zichzelf als een belangrijke speler in dit nieuwe paradigma. Met Kimi K2 Thinking gokt het bedrijf erop dat in een wereld die overspoeld wordt met krachtige modellen, degene die het meest effectief kan redeneren uiteindelijk het ecosysteem van ontwikkelaars zal winnen.

Kimi K2 Benchmarks

LiveCodeBench v6

Pass@1 53,7 46,9 37,0 48,5 47,4 44,7 44,7 Pass@1 27,1 24,0 11,3 15,3 19,6 19,5 19,5 Pass@1 85,7 83,1 78,2 88,6 89,6 86,7 85,6

SWE-bench geverifieerd

Enkele patch zonder test (acc) 51,8 36,6 39,4 50,2 53,0 40,8 32,6

SWE-bench geverifieerd

Enkele poging (Acc) 65,8 38,8 34,4 72,7* 72,5* 54,6 — Meerdere pogingen (Acc) 71,6 — — 80,2* 79,4* — —

SWE-bench Meertalig

Enkel Poging (Acc) 47,3 25,8 20,9 51,0 — 31,5 —

TerminalBench

Intern raamwerk (Acc) 30,0 — — 35,5 43,2 8,3 — Terminus (Acc) 25,0 16,3 6,6 — — 30,3 16,8

Aider-Polyglot

Acc 60,0 55,1 61,8 56,4 70,7 52,4 44,0

Tau2 retail

Gem@4 70,6 69,1 57,0 75,0 81,8 74,8 64,3

Tau2 luchtvaartmaatschappij

Gem@4 56,5 39,0 26,5 55,5 60,0 54,5 42,5

Tau2 telecom

Avg@4 65,8 32,5 22,1 45,2 57,0 38,6 16,9 Acc 76,5 72,7 70,5 76,2 75,6 80,1 74,5 Gem@64 69,6 59,4* 40,1* 43,4 48,2 46,5 61,3 Gem@64 49,5 46,7 24,7* 33,1* 33,9* 37,0 46,6 Acc 97,4 94,0* 91,2* 94,0 94,4 92,4 95,4 Gem@32 38,8 27,5 11,9 15,9 15,9 19,4 34,7 Gem@16 74,3 74,7 48,6 60,4 57,6 56,6 75,0

PolyMath-en

Gem@4 65,1 59,5 51,9 52,8 49,8 54,0 49,9

ZebraLogic

Acc 89,0 84,0 37,7* 79,7 59,3 58,5 57,9 Acc 89,5 88,9 83,3* 89,8 86,1 88,2 84,1

GPQA-Diamond

Gem@8 75,1 68,4* 62,9* 70,0* 74,9* 66,3 68,2 Acc 57,2 53,7 50,2 55,7 56,5 50,8 49,6

Het laatste examen van de mensheid

Acc 4,7 5,2 5,7 5,8 7,1 3,7 5,6 EM 89,5 89,4 87,0 91,5 92,9 90,4 90,1

MMLU-Redux

EM 92,7 90,5 89,2* 93,6 94,2 92,4 90,6 EM 81,1 81,2* 77,3 83,7 86,6 81,8 79,4 Snel Strikt 89,8 81,1 83,2* 87,6 87,4 88,0 84,3

Multi-Challenge

Acc 54,1 31,4 34,0 46,8 49,0 36,4 39,5 Correct 31,0 27,7 13,2 15,9 22,8 42,3 23,3 Pass@1 76,4 72,4 67,6 74,8 74,6 69,8

(Bron: Moonshot AI)

Moonshot AI brengt Kimi K2-denkend open-source AI-model uit, gebouwd voor complex redeneren

Published by All Things Windows on November 6, 2025

Een ‘Thinking Agent’ gebouwd voor complex redeneren en gebruik van hulpmiddelen

Een strategische gok in China’s hevige AI-oorlogen

De mondiale race om agentische suprematie

Kimi K2 Benchmarks

IT Info

Beste MiniDV-camcorders voor 2025 (gratis en betaald)

IT Info

Hoe je een graden-symbool op een toetsenbord maakt

IT Info

PayPal e-mailen (stapsgewijze handleiding)

Moonshot AI brengt Kimi K2-denkend open-source AI-model uit, gebouwd voor complex redeneren

Published by All Things Windows on November 6, 2025

Een ‘Thinking Agent’ gebouwd voor complex redeneren en gebruik van hulpmiddelen

Een strategische gok in China’s hevige AI-oorlogen

De mondiale race om agentische suprematie

Kimi K2 Benchmarks

Related Posts

IT Info

Beste MiniDV-camcorders voor 2025 (gratis en betaald)

IT Info

Hoe je een graden-symbool op een toetsenbord maakt

IT Info

PayPal e-mailen (stapsgewijze handleiding)