Chiński startup AI Z.AI eskaluje zaciętą wojnę cenową AI z nowymi modelami GLM-4.5. Firma, wcześniej Zhipu, ogłosiła w poniedziałek wydanie open source. Umieszcza nowe modele, które są tańsze niż te z kluczowego rywala Deepseek.

Zbudowane do złożonych „agencyjnych” zadań, wydanie jest skierowane do zmiany branży w kierunku autonomicznej sztucznej inteligencji. Systemy te mogą wykonywać instrukcje wieloetapowe. Ten ruch nasila konkurencję w chińskim sektorze technologicznym, w którym firmy walczą teraz zarówno pod względem mocy, jak i ceny.

Uruchomienie występuje również, gdy Z.Ai działa pod sankcjami USA, dodając warstwę geopolityczną do rywalizacji. Modele są dostępne za pośrednictwem platformy Z.AI, API i jako

Under the Hood: Model agencyjny zbudowany dla wydajności

Nowa rodzina GLM-4.5 Z.AI jest zaprojektowana do kolejnej fali aplikacji AI, wykraczając poza proste, podążanie za instrukcjami, aby obejmować bardziej wyrafinowane ramy „agencyjne”. Zgodnie z techniczny post na blogu Modele są zaprojektowane do ujednolicenia rozumowania, kodowania i agenta narzędzia, umożliwiając im autonomiczne rozkładanie złożonych żądań, tworzenia planu i wykonywania tasków bez ciągłych ludzi. Podejście to ma na celu zaspokojenie coraz bardziej skomplikowanych wymagań pojawiających się zastosowań agencyjnych.

Flagowy GLM-4.5 jest potężnym modelem mieszanki ekspertów (MOE), wyborem projektu, który zwiększa wydajność obliczeniową. Chociaż zawiera masywne 355 miliardów parametrów całkowitych, aktywuje tylko 32-miliardowy parametrowy podzbiór dla dowolnego zadania. Z.ai wydało również mniejszy wariant GLM-4,5-Air z 106 miliardami parametrów całkowitych i 12 miliardów aktywnych dla jeszcze większej wydajności. W strategicznym odejściu od rywali takich jak Deepseek-V3 i Kimi K2, Z.Ai priorytetowo traktowali architekturę „głębszą, nie szerszą”, zwiększając liczbę warstw w celu zwiększenia podstawowej zdolności rozumowania modelu.

U podstaw tej architektury jest kilka kluczowych innowacji technicznych. Model wykorzystuje uwagę pogrupowaną i większą liczbę uwagi, aby poprawić wydajność odniesienia rozumowania. Aby zapewnić stabilność podczas ogromnego treningu, który obejmował 15-bilionowy korpus ogólny, a następnie 7-bilionowy kodeks i korpus rozumowania, zespół wykorzystał optymalizator mion i Norm QK do ustabilizowania logitów uwagi. Model zawiera również natywne wywołanie funkcji i długość kontekstu 128k, zarówno kluczowe dla włączenia zaawansowanych zdolności agencyjnych.

Zawiadające, Z.AI twierdzi, że flagowy model może działać tylko na ośmiu układach H20 NVIDIA. Ten sprzęt jest wersją kontrolowaną przez eksport zaprojektowaną dla chińskiego rynku, a wydajność modelu podkreśla strategiczne nacisk na zapewnienie wysokiej wydajności w znacznych ograniczeniach sprzętu. Ta kombinacja zaawansowanej architektury, masywnego szkolenia i optymalizacji sprzętu GLM-4.5 jako potężnego nowego wpisu w globalnym krajobrazie AI.

Wydajność

Według kompleksowych dziedzin opublikowanych przez z. Modele typu open source z Openai, Anthropic i Google. Mniejszy GLM-4,5-Air również działa silnie, zapewniając szóstą pozycję. Dane te sugerują, że Z.AI z powodzeniem opracował model, który konkuruje na granicy zdolności AI, kwestionując ustaloną hierarchię.

W testach zaprojektowanych do pomiaru jego zdolności agencyjnych, GLM-4.5 wykazuje imponujące wyniki. Na funkcji Funkcji Funkcji Celned Funkcja Berkeley (BFCL-V3) jej wydajność pasuje do Sonnet Claude 4. Model przoduje również w złożonych zadaniach przeglądania stron internetowych, przewyższając Claude-4-Opus na trudnym punkcie odniesienia Browsecomp. Jego tryb „myślenia” okazuje się skuteczny w rozumowaniu zaawansowanym, osiągając wynik 91,0 w teście konkurencji matematycznej AIME24 i 79,1 w zakresie testu pytań na poziomie GPQA. Grok 4 mmlu pro 84,6 81,4 85,3 87,3 86,2 84,9 84,5 86,6 Aime24 91,0 89,4 90,3 75,7 88,7 89,3 94,1 94,3 Matematyka 500 98,2 98,1 99,2 98,2 96,7 98,3 98,0 99,0 SCICODE 42,8 40,3 42,9 45,7 GPQA 79,1 75,0 82,7 79,6 84,4 81,3 81,1 87,7 Hle 14,4 10,6 20,0 11,7 21,1 14,9 15,8 23,9 LiveCodeBench (2407-2501) 72,9 70,7 78,4 63,6 80,1 77,0 78,9 81.9 AA-INDEX (Oszacowane) 67,7 64,8 70,0 64,4 70,5 68,3 69,4 73,2

Możliwości kodowania modelu są równie solidne. W bezpośredniej, wielozadaniowej oceny człowieka przy użyciu znormalizowanej ramy kodowania, GLM-4.5 osiągnął 53,9% wskaźnik wygranych w stosunku do KIMI K2 księżyca i zdominował koder QWEN3 Alibaba z wskaźnikiem sukcesu 80,8%. Z.ai podaje również wskaźnik powodzenia w połączeniu z narzędziami wynoszącym 90,6%, najwyższy wśród rówieśników, wykazując doskonałą niezawodność zadań kodowania agencji. Pełne trajektorie tych testów były udostępniono publicznie do przeglądu społeczności .

Benchmarmark GLM-4.5 GLM-4.5-air o3 gpt-4.1 Pro Deepseek-R1-0528 KIMI K2 SWE Bench Verified 1 64,2 57,6 69,1 48,6 67,8 70,4 49,0 41,4 65,4 Bench zaciskowy 2 37,5 30 30,2 30,3 43,2 35,5 25,3 17,5 25,0

To mocne wydajność jest parą z najdbawniejszą wydajnością. Analiza granic Pareto przeprowadzona przez Z.AI pokazuje, że zarówno GLM-4.5, jak i GLM-4.5-Air siedzą na optymalnej granicy kompromisowej skali wydajności w porównaniu do skali modelu. Wskazuje to, że modele osiągają swoje wyniki najwyższego poziomu bez kosztów obliczeniowych podobnie potężnych konkurentów, wzmacniając strategiczne koncentrację firmy na zapewnianiu zarówno wysokiej wydajności, jak i opłacalności.

Escalacji zaciekłej chińskiej wojny o cenę AI

Wydanie jest bezpośrednim ujęciem, najbardziej skonfigurowanie głębin. Z.ai wyraźnie podcina rywal w cenie. Firma będzie pobierać 11 centów za milion tokenów wejściowych dla GLM-4,5, w porównaniu z 14 centów zagłębienia głębokości dla swojego modelu R1.

Ta agresywna cena kontynuuje trend, który zbierał sektor AI. Sama Deepeek zyskała na znaczeniu, oferując usługi za ułamek kosztów modeli Openai. Teraz Z.AI intensyfikuje tę wojnę cenową, zmuszając firmy do konkurowania o wydajność, a nie tylko surową moc.

Według własnych punktów odniesienia Z.Ai, GLM-4.5 konkuruje pozytywnie z najwyższej jakości modele z openai, Google i antropiki w zakresie rozumowania, kodowania i agencji. Pole Mineffield

Zasługę techniczną Z.AI są ustalone na tle intensywnej presji geopolitycznej. Firma pod swoją dawną nazwą Zhipu była

Openai również wcześniej . Takie podejście zachęca do globalnej współpracy, nawet gdy powstają napięcia geopolityczne.