Fillimi Kinez i AI-së Z.AI po përshkallëzon luftën e çmimeve të AI të AI të vendit me modelet e saj të reja GLM-4.5. Kompania, dikur Zhipu, njoftoi lëshimin me burim të hapur të hënën. Ai pozicionon që modelet e reja të jenë më të lira se ato nga rivalja kryesore Deepseek. Këto sisteme mund të ekzekutojnë udhëzime me shumë hapa. Kjo veprim intensifikon konkurrencën në sektorin e teknologjisë së Kinës, ku firmat tani luftojnë si në fuqi ashtu edhe me çmim. Modelet janë të disponueshme përmes platformës Z.AI, një API, dhe si e hapur në fytyrën përqafuese .”lartësia=”626″src=”të dhëna: imazh/svg+xml; nitro-impty-id=mtc5mzoxmtm3-1; base64, phn2zyb2awv3qm94psiwidagmti4mca3nz giihdpzhropsixmjgwiibozwlnahq9ijc3ocigeg1sbnm9imh0dha6ly93d3cudzmub3jnlziwmdavc3znij48l3n2zz4=”>

Nën kapuç: Një model agjent i ndërtuar për efikasitet

familja e re GLM-4.5 e Z.AI është krijuar për valën tjetër të aplikacioneve të AI, duke lëvizur përtej udhëzimeve të thjeshta për të përqafuar një kornizë më të sofistikuar”agjentike”. Sipas postimi teknik i blogut , modelet janë krijuar për të unifikuar arsyetimin, kodimin dhe përdorimin e mjeteve agjentike, duke i lejuar ata të prishin autonome kërkesa komplekse, të formojnë një plan, dhe të ekzekutojnë detyra të vazhdueshme pa udhëzime njerëzore. Kjo qasje synon të plotësojë kërkesat gjithnjë e më të komplikuara të aplikacioneve të agjentit në zhvillim. Ndërsa përmban një parametër total masiv 355 miliardë, ai aktivizon vetëm një nënbashkësi prej 32 miliardë parametri për çdo detyrë të caktuar. Z.AI lëshoi gjithashtu një variant më të vogël GLM-4.5-Air me 106 miliardë parametra total dhe 12 miliardë ato aktive për një efikasitet edhe më të madh. Në një largim strategjik nga rivalët si Deepseek-V3 dhe Kimi K2, Z.AI i dha përparësi një arkitekture”më të thellë, jo më të gjerë”, duke rritur numrin e shtresave për të përmirësuar aftësinë thelbësore të arsyetimit të modelit. Modeli përdor vëmendjen e grupit të kërkuar dhe një numër më të madh të kokat e vëmendjes për të përmirësuar performancën në standardet e arsyetimit. Për të siguruar stabilitetin gjatë ekzekutimit të tij masiv të trajnimit, i cili përfshinte një korpus të përgjithshëm 15 trilion-trilluar, i ndjekur nga një kod me 7 trilion-gues dhe korpus arsyetimi, ekipi përdori një Muon Optimizer dhe QK-norm për të stabilizuar logjet e vëmendjes. Modeli gjithashtu përmban thirrjen e funksionit vendas dhe një gjatësi konteksti 128K, të dyja kritike për të mundësuar aftësitë e tij të përparuara të agjentit. Ky harduer është versioni i kontrolluar nga eksporti i krijuar për tregun kinez, dhe efikasiteti i modelit nënvizon një përqendrim strategjik në ofrimin e performancës së lartë brenda kufizimeve të rëndësishme të harduerit. Ky kombinim i arkitekturës së përparuar, trajnimit në shkallë masive dhe pozicioneve të optimizmit të harduerit GLM-4.5 si një hyrje e re e frikshme në peizazhin global të AI. Modele me burim të hapur nga Openai, Antropic dhe Google. GLM-4.5-ajri më i vogël gjithashtu performon fuqimisht, duke siguruar pozicionin e gjashtë. Këto të dhëna sugjerojnë që Z.AI ka zhvilluar me sukses një model që garon në kufirin e aftësisë së AI, duke sfiduar hierarkinë e vendosur. Në funksionin-bench dhe Berkeley duke e quajtur Leaderboard (BFCL-V3), performanca e tij përputhet me atë të Sonet Claude 4. Modeli gjithashtu shkëlqen në detyra komplekse të shfletimit në internet, duke tejkaluar Claude-4-opus në standardin sfidues të Browsecomp. Mënyra e saj”të menduarit”rezulton efektive në arsyetimin e përparuar, duke arritur një rezultat prej 91.0 në provën e konkurrencës së matematikës AIME24 dhe 79.1 në standardin e pyetjeve të nivelit të diplomuar GPQA të nivelit të diplomuar. GROK 4 MMLU PRO 84.6 81.4 85.3 87.3 86.2 84.9 84.5 86.6 AIME24 91.0 89.4 90.3 75.7 88.7 89.3 94.1 94.3 MATH 500 98.2 98.1 99.2 98.2 96.7 98.3 98.0 99.0 SCICode 41.7.7.3.3.3.3.3.3 41.3 41.3 41.3. 42.8 40.3 42.9 45.7 GPQA 79.1 75.0 82.7 79.6 84.4 81.3 81.1 87.7 HLE 14.4 10.6 20.0 11.7 21.1 14.9 15.8 23.9 LiveCodebench (2407-2501) 72.9 70.7 78.4 63.6 80.1 77.0 78.2.2 81.9 (Vlerësuar) 67.7 64.8 70.0 64.4 70.5 68.3 69.4 73.2

Aftësitë e kodimit të modelit janë po aq të forta. Në një vlerësim njerëzor të drejtpërdrejtë, shumë-raund, duke përdorur një kornizë të standardizuar të kodimit, GLM-4.5 arriti një normë fitore 53.9% kundër Kimi K2 të Moonshot dhe mbizotëroi Alibaba QWEN3-kodrina me një normë suksesi 80.8%. Z.AI gjithashtu raporton një normë suksesi të thirrjes së mjeteve prej 90.6%, më e larta në mesin e bashkëmoshatarëve të saj, duke demonstruar besueshmëri superiore për detyrat e kodimit agjent. Trajektorët e plotë për këto teste kanë qenë . 2.5 Pro Deepseek-R1-0528 Kimi K2 SWE-Bench Verified1 64.2 57.6 69.1 48.6 67.8 70.4 49.0 41.4 65.4 Terminal-Bench2 37.5 30.2 30.3 43.2 35.5 25.3 17.5 25.0

Kjo performancë e fortë është e çiftuar me efikasitet të vërejtur. Një analizë pareto kufitare e realizuar nga Z.AI tregon se të dy GLM-4.5 dhe GLM-4.5-Air ulen në kufirin optimal të tregtisë për performancën kundrejt shkallës së modelit. Kjo tregon që modelet arrijnë rezultatet e tyre të nivelit të lartë pa pjesën e sipërme llogaritëse të konkurrentëve në mënyrë të ngjashme të fuqishme, duke forcuar fokusin strategjik të kompanisë në ofrimin e performancës së lartë dhe kosto-efektivitetit. Z.AI është duke nënvizuar në mënyrë të qartë rivalin e tij në çmim. Kompania do të ngarkojë 11 cent për milion shenja hyrëse për GLM-4.5, në krahasim me 14 cent akuzat Deepseek për modelin e saj R1. Vetë Deepseek fitoi rëndësi duke ofruar shërbime me një pjesë të kostos së modeleve të Openai. Tani, Z.AI po e intensifikon këtë luftë çmimesh, duke detyruar kompanitë të konkurrojnë në efikasitet, jo vetëm fuqi të papërpunuar. Minefield

Përparimet teknike të z.AI janë vendosur kundër një sfondi të presionit intensiv gjeopolitik. Kompania, nën emrin e saj të mëparshëm Zhipu, ishte

Koha është gjithashtu kritike. Nisja e Z.Ai vjen ndërsa vrulli i Deepseek raportohet se ka ngecur. Modeli R2 i shumëpritur i kompanisë është vonuar pafundësisht, pjesërisht për shkak të mungesave të harduerit Z.AI ka krijuar modelet e saj për të lundruar. Qëllimi është të kalojë përtej chatbots që u përgjigjen pyetjeve tek agjentët autonome që përfundojnë detyra. Kjo prirje tashmë po vërtetohet në botën e korporatave. Shefi i teknologjisë Marco Argenti shpjegoi vizionin, duke thënë,”ka të bëjë me njerëzit dhe AI-të që punojnë krah për krah. Inxhinierët pritet të kenë aftësinë të përshkruajnë me të vërtetë problemet në një mënyrë koherente…”Kjo pasqyron një të ardhme ku njerëzit mbikëqyrin AI, jo vetëm ta përdorin atë si një mjet. Alibaba kohët e fundit lëshoi QWEN3-Coder dhe Moonshot AI nisi modelin e saj Kimi K2, të dy duke synuar aftësitë agjentë. Edhe Sam Altman i Openai pranoi presionin konkurrues nga Kina, duke premtuar në fillim të këtij viti,”Ne padyshim që do të ofrojmë modele shumë më të mira dhe gjithashtu do të tërheqim disa lëshime.”Kjo qasje fton bashkëpunimin global edhe kur rriten tensionet gjeopolitike.