Kinesisk AI-oppstart Z.AI eskalerer landets voldsomme AI-priskrig med sine nye GLM-4.5-modeller. Selskapet, tidligere Zhipu, kunngjorde open source-utgivelsen mandag. Den posisjonerer de nye modellene som skal være billigere enn de fra viktige rivaliserende DeepSeek.

Bygget for komplekse “agentiske” oppgaver, utgivelsen retter seg mot bransjens skifte mot autonome AI. Disse systemene kan utføre instruksjoner om flere trinn. Dette trekket forsterker konkurransen i Kinas teknologisektor, der firmaer nå kjemper om både makt og pris.

Lanseringen skjer også når Z.AI opererer under amerikanske sanksjoner, og legger til et geopolitisk lag til rivaliseringen. Modellene er tilgjengelige via Z.AI-plattformen, en API, og som openthwweight på hugging facing facing faces på høyde=”626″src=”data: image/svg+xml; nitro-tom-id=mtc5mzoxmtm3-1; base64, phn2zyb2awv3qm94psiwidagmti4mca3nz Giihdpzhropsixmjgwiibozwlnahq9ijc3ocigeg1sbnm9imH0dha6ly93d3cudzmub3jnlziwmdavc3znij48l3n2zz4=”>

under panseret: En agentmodell bygget for effektivitet

Z.AIs nye GLM-4.5-familie er konstruert for neste bølge av AI-applikasjoner, og beveger seg utover enkel instruksjon som følger for å omfavne et mer sofistikert”agentisk”rammeverk. I følge selskapets teknisk blogginnlegg , er modellene designet for å forene resonnement, koding og agentverktøybruk, slik at de kan bryte ned komplekse forespørsler, danne en plan, og utføre tasker uten å videreføre menneskelige menneskelige menneskelige. Denne tilnærmingen tar sikte på å tilfredsstille de stadig mer kompliserte kravene til nye agentiske applikasjoner.

Flaggskipet GLM-4.5 er en kraftig blanding-av-ekspert (MOE)-modell, et designvalg som forbedrer beregningseffektiviteten. Selv om den inneholder enorme 355 milliarder totale parametere, aktiverer den bare en undergruppe på 32 milliarder dollar for en gitt oppgave. Z.AI ga også ut en mindre GLM-4,5-luftvariant med 106 milliarder totale parametere og 12 milliarder aktive for enda større effektivitet. I en strategisk avgang fra rivaler som DeepSeek-V3 og Kimi K2, prioriterte Z.AI en”dypere, ikke bredere”arkitektur, og økte antall lag for å forbedre modellens kjerne resonnementskapasitet.

Å understøtte denne arkitekturen er flere viktige tekniske innovasjoner. Modellen bruker gruppert oppmerksomhet og et høyere antall oppmerksomhetshoder for å forbedre ytelsen på resonnerende benchmarks. For å sikre stabilitet under det enorme treningsløpet, som involverte et 15-billion-token generell korpus etterfulgt av en 7-billion-token kode og resonnerende korpus, benyttet teamet en Muon Optimizer og QK-Norm for å stabilisere oppmerksomhetslogger. Modellen har også innfødt funksjonsanrop og en 128K kontekstlengde, begge kritiske for å muliggjøre dens avanserte agentiske evner.

Bemerkelsesverdig, Z.AI hevder at flaggskipsmodellen kan fungere på bare åtte av NVIDIAs H20-brikker. Denne maskinvaren er den eksportkontrollerte versjonen designet for det kinesiske markedet, og modellens effektivitet understreker et strategisk fokus på å levere høy ytelse innenfor betydelige maskinvarebegrensninger. This combination of advanced architecture, massive-scale training, and hardware optimization positions GLM-4.5 as a formidable new entry in the global AI landscape.

Performance

According to comprehensive benchmarks published by Z.ai, the new GLM-4.5 model establishes itself as a top-tier contender, ranking third overall against a field of leading proprietary and Open source-modeller fra Openai, Anthropic og Google. Den mindre GLM-4.5-luften utfører også sterkt, og sikrer den sjette plassering. Disse dataene antyder at Z.AI med hell har utviklet en modell som konkurrerer på grensen til AI-evnen, og utfordrer det etablerte hierarkiet.

I tester designet for å måle dets agentiske evner, viser GLM-4.5 imponerende resultater. På-benken og Berkeley-funksjonen som ringer toppliste (BFCL-V3), samsvarer ytelsen til Claude 4 Sonnet. Modellen utmerker seg også med komplekse nettleseroppgaver, og overgår CLAUDE-4-OPUS om det utfordrende BROWSECOMP BENCHMARK. Its “thinking”mode proves effective in advanced reasoning, achieving a score of 91.0 on the AIME24 math competition test and 79.1 on the GPQA graduate-level question-answering benchmark.

Benchmark GLM-4.5 GLM-4.5-Air o3 Claude 4 Opus Gemini 2.5 Pro DeepSeek-R1-0528 Qwen3-235B-Thinking 2507 Grok 4 MMLU Pro 84.6 81.4 85.3 87.3 86.2 84.9 84.5 86.6 AIME24 91.0 89.4 90.3 75.7 88.7 89.3 94.1 94.3 MATH 500 98.2 98.1 99.2 98.2 96.7 98.3 98.0 99.0 SciCode 41.7 37.3 41.0 39.8 42.8 40.3 42.9 45.7 GPQA 79.1 75.0 82.7 79.6 84.4 81.3 81.1 87.7 HLE 14.4 10.6 20.0 11.7 21.1 14.9 15.8 23.9 LiveCodeBench (2407-2501) 72.9 70.7 78,4 63,6 80,1 77,0 78,2 81,9 AA-indeks (estimert) 67,7 64,8 70,0 64,4 70,5 68,3 69,4 73,2

Modellens kodingsfunksjoner er like robus. I en direkte, multi-runde menneskelig evaluering ved bruk av et standardisert kodingsrammeverk, oppnådde GLM-4,5 en seier på 53,9% mot Moonshots Kimi K2 og dominerte Alibabas Qwen3-koder med en suksessrate på 80,8%. Z.AI rapporterer også en suksessrate på verktøy på 90,6%, den høyeste blant sine jevnaldrende, og viser overlegen pålitelighet for agentkodingsoppgaver. De fulle banene for disse testene har vært gjort offentlig tilgjengelig for community gjennomgang

Benchmark Glm-4.5 Glm-4.5-5-5-5-5-5-5-5-4-5-5-4-4.5-4.5. Sonnet Gemini 2.5 Pro DeepSeek-R1-0528 Kimi K2 Swe-Bench Verified1 64.2 57.6 69.1 48.6 67.8 70.4 49.0 41. 65,2 Terminal-Barkerable 2 37,5 30 30,2 30,3 43,2 35,5 37,5 37,5 37,5 37,5 37,5 37,5 dollar. effektivitet. En Pareto Frontier-analyse utført av Z.AI viser at både GLM-4.5 og GLM-4.5-Air sitter på den optimale avveiningsgrensen for ytelse versus modellskala. Dette indikerer at modellene oppnår sine toppnivåer uten beregningsmessige overhead for lignende kraftige konkurrenter, og forsterker selskapets strategiske fokus på å levere både høy ytelse og kostnadseffektivitet.

Escalating Kinas Fierce AI Price War

Denne aggressive prisingen fortsetter en trend som har løst AI-sektoren. DeepSeek fikk seg selv fremtredende ved å tilby tjenester til en brøkdel av kostnadene for Openais modeller. Nå intensiverer Z.AI denne priskrigen, og tvinger selskaper til å konkurrere om effektivitet, ikke bare rå kraft.

I henhold til Z.AIs egne benchmarks konkurrerer GLM-4.5 gunstig med toppnivå-modeller fra OpenAi, Google og antropic på et utvalg av en ny CONTER og Agentic-tester.

Minefield

Z.AIs tekniske fremskritt er satt på bakgrunn av intens geopolitisk trykk. Selskapet, under det tidligere navnet Zhipu, var Flagged the StartUps Rapid-Raft Raft Prograph Progch Progch Progch Progrogry. Den amerikanske regjeringen har uttrykt dype bekymringer for kinesisk AI-utvikling. En fersk husutvalgsrapport merket rival DeepSeek En sikkerhetstrussel, med styreleder John Moolenaar som sier:”Denne rapporten gjør det klart: DeepSeek er ikke bare en annen AI-app-det er et våpen i det kinesiske kommunistpartiets arsenal…”

Dette miljøet tvinger kinesiske firmaer til å innovere under begrensninger. Avhengigheten av NVIDIAs H20-brikker er en direkte konsekvens av amerikanske eksportkontroller som tar sikte på å bremse Kinas AI-ambisjoner. Likevel fortalte Z.AI-administrerende direktør Zhang Peng CNBC at selskapet har nok datakraft, og sa:”Selskapet trenger ikke å kjøpe mer av brikkene, da det har nok datakraft for nå.”

Tidspunktet er også kritisk. Z.AIs lansering kommer ettersom DeepSeek momentum angivelig har stoppet. Selskapets svært etterlengtede R2-modell er blitt forsinket på ubestemt tid, delvis på grunn av veldig maskinvaremangel Z.AI har konstruert sine modeller for å navigere.

Det globale løpet for agent overherredømme

Fokuset på”Agentic AI”plasserer Z.AI i forkant av et fundamentalt industri. Målet er å bevege seg utover chatbots som svarer på spørsmål til autonome agenter som fullfører oppgaver. Denne trenden blir allerede validert i bedriftsverdenen.

Investment Bank Goldman Sachs, for eksempel, piloterer AI-agenter for å skape en”hybrid arbeidsstyrke.”Teknisk sjef Marco Argenti forklarte visjonen og sa:”Det handler egentlig om mennesker og AIS som jobber side om side. Det forventes at ingeniører har muligheten til å virkelig beskrive problemer på en sammenhengende måte…”Dette gjenspeiler en fremtid der mennesker overvåker AI, ikke bare bruk det som et verktøy.

Z.AI er ikke alene i dette løpet. Alibaba ga nylig ut sin Qwen3-koder og Moonshot AI lanserte sin Kimi K2-modell, begge målrettet agentfunksjoner. Til og med Openais Sam Altman erkjente konkurransepresset fra Kina, lovende tidligere i år,”Vi vil åpenbart levere mye bedre modeller og også trekke opp noen utgivelser.”

ved å åpne glm-4.5, Z.AI lager en