Khởi nghiệp AI của Trung Quốc Z.AI đang leo thang cuộc chiến giá AI dữ dội của quốc gia với các mẫu GLM-4.5 mới. Công ty, trước đây là ZHIPU, đã công bố phát hành nguồn mở vào thứ Hai. Nó định vị các mô hình mới là rẻ hơn so với các mô hình từ đối thủ chính của Deepseek. Các hệ thống này có thể thực hiện các hướng dẫn nhiều bước. Động thái này tăng cường cạnh tranh trong lĩnh vực công nghệ Trung Quốc, nơi các công ty hiện đang chiến đấu với cả quyền lực và giá cả. Các mô hình có sẵn thông qua nền tảng Z.AI, API và

dưới mui xe: Một mô hình tác nhân được xây dựng cho hiệu quả

Z.AI, gia đình GLM-4.5 mới được thiết kế cho làn sóng AI tiếp theo của các ứng dụng AI, vượt ra ngoài khung hướng dẫn đơn giản để nắm lấy một khung tác nhân tinh vi hơn”. Theo công ty Lừa Bài đăng trên blog kỹ thuật , các mô hình được thiết kế để thống nhất lý luận, mã hóa và sử dụng công cụ đại lý, cho phép chúng tự chủ phá vỡ các yêu cầu phức tạp, hình thành kế hoạch và thực hiện các ứng xử không liên tục. Cách tiếp cận này nhằm mục đích đáp ứng các yêu cầu ngày càng phức tạp của các ứng dụng tác nhân mới nổi. Mặc dù nó chứa tổng số tham số lớn 355 tỷ, nhưng nó chỉ kích hoạt một tập hợp con tham số 32 tỷ cho bất kỳ nhiệm vụ nào. Z.AI cũng đã phát hành một biến thể GLM-4,5-AIR nhỏ hơn với tổng số 106 tỷ thông số và 12 tỷ hoạt động để có hiệu quả cao hơn. Trong một sự khởi đầu chiến lược từ các đối thủ như Deepseek-V3 và Kimi K2, Z.AI đã ưu tiên một kiến trúc sâu hơn, không rộng hơn”, tăng số lượng lớp để tăng cường khả năng lý luận cốt lõi của mô hình. Mô hình sử dụng sự chú ý theo nhóm và số lượng người đứng đầu chú ý cao hơn để cải thiện hiệu suất trên các điểm chuẩn lý luận. Để đảm bảo sự ổn định trong quá trình đào tạo lớn, liên quan đến một tổng thể nói chung 15 nghìn tỷ, sau đó là một bộ luật 7 nghìn tỷ nói, nhóm đã sử dụng một trình tối ưu hóa muon và QK-Norm để ổn định nhật ký chú ý. Mô hình cũng có tính năng gọi chức năng gốc và độ dài bối cảnh 128K, cả hai đều rất quan trọng để cho phép các khả năng tác nhân tiên tiến của nó. Phần cứng này là phiên bản được kiểm soát xuất khẩu được thiết kế cho thị trường Trung Quốc và hiệu quả của mô hình nhấn mạnh một trọng tâm chiến lược vào việc cung cấp hiệu suất cao trong các ràng buộc phần cứng quan trọng. Sự kết hợp của kiến trúc nâng cao, đào tạo quy mô lớn và vị trí tối ưu hóa phần cứng GLM-4.5 như một mục mới đáng gờm trong cảnh quan AI toàn cầu. Các mô hình nguồn mở từ Openai, Anthropic và Google. GLM-4.5-AIR nhỏ hơn cũng hoạt động mạnh mẽ, đảm bảo vị trí thứ sáu. Dữ liệu này cho thấy Z.AI đã phát triển thành công một mô hình cạnh tranh ở biên giới của khả năng AI, thách thức hệ thống phân cấp đã được thiết lập. Trên bảng xếp hạng gọi chức năng-bench và Berkeley (BFCL-V3), hiệu suất của nó phù hợp với Claude 4 Sonnet. Mô hình này cũng vượt trội so với các tác vụ duyệt web phức tạp, vượt trội so với Claude-4-Opus trên điểm chuẩn Browsecomp đầy thách thức. Chế độ suy nghĩ của nó”chứng minh hiệu quả trong lý luận nâng cao, đạt được số điểm 91.0 trong bài kiểm tra cạnh tranh toán học AIME24 và 79.1 trên điểm chuẩn câu hỏi cấp độ GPQA. 4 MMLU Pro 84.6 81.4 85.3 87.3 86.2 84.9 84.5 86.6 AIME24 91.0 89.4 90.3 75.7 88.7 89.3 94.1 94.3 MATH 500 98.2 98.1 99.2 98.2 96 42.8 40.3 42.9 45.7 GPQA 79.1 75.0 82.7 79.6 84.4 81.3 81.1 87.7 HLE 14.4 10.6 20.0 11.7 21.1 14.9 15.8 23.9 LiveCodeBench (2407-2501). Trong một đánh giá trực tiếp, đa vòng của con người bằng cách sử dụng khung mã hóa được tiêu chuẩn hóa, GLM-4.5 đã đạt được tỷ lệ thắng 53,9% so với Moonshot, Kimi K2 và thống trị bộ mã hóa Alibaba tựa QWEN3 với tỷ lệ thành công 80,8%. Z.AI cũng báo cáo tỷ lệ gọi công cụ là 90,6%, cao nhất trong số các đồng nghiệp của nó, thể hiện độ tin cậy vượt trội đối với các nhiệm vụ mã hóa tác nhân. Các quỹ đạo đầy đủ cho các thử nghiệm này đã được . Chính phủ Hoa Kỳ đã bày tỏ mối quan tâm sâu sắc đối với sự phát triển AI của Trung Quốc. Một báo cáo gần đây của Ủy ban Hạ viện, đối thủ có thương hiệu Deepseek là một mối đe dọa an ninh, với chủ tịch John Moolenaar nói rằng, báo cáo này làm rõ: Deepseek isn chỉ là một ứng dụng AI khác-đó là một vũ khí trong Đảng Cộng sản Trung Quốc Sự phụ thuộc vào chip NVIDIA từ H20 là hậu quả trực tiếp của các biện pháp kiểm soát xuất khẩu của Hoa Kỳ nhằm làm chậm tham vọng AI của Trung Quốc. Tuy nhiên, Giám đốc điều hành của Z.AI, Zhang Peng nói với CNBC rằng công ty có đủ sức mạnh tính toán, nói rằng, Công ty không cần phải mua thêm chip vì hiện tại nó có đủ sức mạnh tính toán.”

Thời gian cũng rất quan trọng. Sự ra mắt của Z.AI, xuất hiện khi động lực của Deepseek đã bị đình trệ. Mô hình R2 rất được mong đợi của công ty đã bị trì hoãn vô thời hạn, một phần do tình trạng thiếu phần cứng Z.AI đã thiết kế các mô hình của mình để điều hướng. Mục tiêu là vượt ra ngoài các chatbot trả lời các câu hỏi cho các tác nhân tự trị hoàn thành các nhiệm vụ. Xu hướng này đã được xác nhận trong thế giới doanh nghiệp. Giám đốc công nghệ Marco Argenti đã giải thích tầm nhìn, nói rằng, nó thực sự về những người và AIS làm việc cạnh nhau. Các kỹ sư sẽ được kỳ vọng có khả năng thực sự mô tả các vấn đề theo cách mạch lạc”, điều này phản ánh một tương lai mà con người giám sát AI, không chỉ sử dụng nó như một công cụ. Alibaba gần đây đã phát hành QWEN3 Coder và Moonshot AI đã ra mắt mô hình KIMI K2 của mình, cả hai đều nhắm mục tiêu các khả năng của tác nhân. Ngay cả Openai, Sam Altman cũng thừa nhận áp lực cạnh tranh từ Trung Quốc, hứa hẹn vào đầu năm nay, rõ ràng chúng tôi sẽ cung cấp các mô hình tốt hơn nhiều và cũng kéo lên một số bản phát hành.”nhận con nuôi . Cách tiếp cận này mời sự hợp tác toàn cầu ngay cả khi căng thẳng địa chính trị tăng lên.

Categories: IT Info