การเริ่มต้นของจีน AI z.ai กำลังเพิ่มสงครามราคา AI ที่ดุเดือดของประเทศด้วยรุ่น GLM-40.5 ใหม่ บริษัท เดิมชื่อ Zhipu ประกาศเปิดตัวโอเพ่นซอร์สในวันจันทร์ มันวางตำแหน่งโมเดลใหม่ที่จะถูกกว่ารุ่นที่สำคัญของคู่แข่ง Deepseek
สร้างขึ้นสำหรับงานที่ซับซ้อน”ตัวแทน”การเปิดตัวเป้าหมายการเปลี่ยนอุตสาหกรรมไปสู่ AI อิสระ ระบบเหล่านี้สามารถดำเนินการตามคำแนะนำหลายขั้นตอน การเคลื่อนไหวครั้งนี้ทวีความรุนแรงมากขึ้นในการแข่งขันในภาคเทคโนโลยีของจีนซึ่ง บริษัท ต่างๆต่อสู้กับทั้งอำนาจและราคา
การเปิดตัวยังเกิดขึ้นเมื่อ Z.AI ดำเนินการภายใต้การคว่ำบาตรของสหรัฐอเมริกา โมเดลมีให้บริการผ่านแพลตฟอร์ม Z.AI, API และ AS โพสต์บล็อกทางเทคนิค โมเดลได้รับการออกแบบมาเพื่อรวมการใช้เหตุผลการเข้ารหัสและการใช้เครื่องมือที่เป็นตัวแทน วิธีการนี้มีวัตถุประสงค์เพื่อตอบสนองความต้องการที่ซับซ้อนมากขึ้นของแอพพลิเคชั่นตัวแทนที่เกิดขึ้นใหม่
ธง GLM-4.5 ที่เป็นเรือธงเป็นรูปแบบการผสมผสานที่ทรงพลังของ Experts (MOE) ตัวเลือกการออกแบบที่ช่วยเพิ่มประสิทธิภาพการคำนวณ ในขณะที่มันมีพารามิเตอร์ทั้งหมด 355 พันล้านพารามิเตอร์ แต่จะเปิดใช้งานชุดย่อย 32 พันล้านพารามิเตอร์สำหรับงานใด ๆ ที่กำหนด Z.AI ยังเปิดตัวตัวแปร GLM-4.5-Air ที่เล็กกว่าด้วยพารามิเตอร์ทั้งหมด 106 พันล้านพารามิเตอร์และ 12 พันล้านตัวที่ใช้งานอยู่เพื่อประสิทธิภาพที่มากยิ่งขึ้น ในการออกจากกลยุทธ์จากคู่แข่งเช่น Deepseek-V3 และ Kimi K2, Z.AI จัดลำดับความสำคัญของสถาปัตยกรรมที่“ ลึกกว่าไม่กว้างขึ้น” เพิ่มจำนวนเลเยอร์เพื่อเพิ่มความสามารถในการใช้เหตุผลหลักของโมเดล
การสนับสนุนสถาปัตยกรรมนี้เป็นนวัตกรรมทางเทคนิคที่สำคัญ โมเดลใช้ความสนใจแบบกลุ่มและมีความสนใจจำนวนมากขึ้นเพื่อปรับปรุงประสิทธิภาพการทำงานของมาตรฐานการใช้เหตุผล เพื่อให้มั่นใจว่ามีความเสถียรในระหว่างการฝึกอบรมครั้งใหญ่ซึ่งเกี่ยวข้องกับคลังข้อมูลทั่วไป 15 ล้านล้านล้านคนตามด้วยรหัส 7-troken และคลังข้อมูลที่ให้เหตุผลทีมใช้ Muon Optimizer และ QK-Norm เพื่อรักษาความสนใจ โมเดลยังมีการเรียกใช้ฟังก์ชันพื้นเมืองและความยาวบริบท 128K ทั้งสองอย่างมีความสำคัญต่อการเปิดใช้งานความสามารถของตัวแทนขั้นสูง
อย่างน่าทึ่ง Z.AI อ้างว่าโมเดลเรือธงสามารถทำงานบนชิป H20 ของ Nvidia เพียงแปดแห่ง ฮาร์ดแวร์นี้เป็นรุ่นควบคุมการส่งออกที่ออกแบบมาสำหรับตลาดจีนและประสิทธิภาพของโมเดลนั้นเน้นย้ำถึงการมุ่งเน้นเชิงกลยุทธ์ในการส่งมอบประสิทธิภาพสูงภายในข้อ จำกัด ของฮาร์ดแวร์ที่สำคัญ การรวมกันของสถาปัตยกรรมขั้นสูงการฝึกอบรมขนาดใหญ่และการเพิ่มประสิทธิภาพฮาร์ดแวร์ตำแหน่ง GLM-4.5 เป็นรายการใหม่ที่น่าเกรงขามในภูมิทัศน์ AI ทั่วโลก
ประสิทธิภาพ
โมเดลที่เป็นกรรมสิทธิ์และโอเพ่นซอร์สจาก Openai, Manthropic และ Google GLM-4.5-Air ที่เล็กกว่านั้นยังทำงานได้อย่างยิ่งและรักษาตำแหน่งที่หก ข้อมูลนี้แสดงให้เห็นว่า Z.AI ได้พัฒนาแบบจำลองที่แข่งขันได้ที่ Frontier of AI ความสามารถท้าทายลำดับชั้นที่จัดตั้งขึ้น
ในการทดสอบที่ออกแบบมาเพื่อวัดความสามารถของตัวแทน GLM-4.5 แสดงให้เห็นถึงผลลัพธ์ที่น่าประทับใจ ในฟังก์ชั่น-Bench และ Berkeley Calling Leadyboard (BFCL-V3) ประสิทธิภาพของมันตรงกับของ Claude 4 Sonnet โมเดลนี้ยังเก่งในงานการท่องเว็บที่ซับซ้อนซึ่งมีประสิทธิภาพสูงกว่า Claude-4-Opus ในเกณฑ์มาตรฐานการเรียกดูที่ท้าทาย โหมด“ การคิด” พิสูจน์ได้ว่ามีประสิทธิภาพในการให้เหตุผลขั้นสูงโดยได้คะแนน 91.0 ในการทดสอบการแข่งขันทางคณิตศาสตร์ AIME24 และ 79.1 ในเกณฑ์มาตรฐานการตอบคำถามระดับบัณฑิตศึกษาของ GPQA 2507 Grok 4 mmlu Pro 84.6 81.4 85.3 87.3 86.2 84.9 84.5 86.6 AIME24 91.0 89.4 90.3 75.7 88.7 89.3 94.1 94.3 คณิตศาสตร์ 500 98.2 98.1 99.2 98.2 96.2 37.3 41.0 39.8 42.8 40.3 42.9 45.7 GPQA 79.1 75.0 82.7 79.6 84.4 81.3 81.1 87.7 HLE 14.4 10.6 20.0 11.7 21.1 14.9 15.8 23.9 LiveCodeBench 78.2 81.9 AA-INDEX (ประมาณ) 67.7 64.8 70.0 64.4 70.5 68.3 69.4 73.2
ความสามารถในการเข้ารหัสของโมเดลนั้นแข็งแกร่งพอ ๆ กัน ในการประเมินผลของมนุษย์หลายรอบโดยตรงโดยใช้กรอบการเข้ารหัสมาตรฐาน GLM-4.5 ได้รับอัตราการชนะ 53.9% เมื่อเทียบกับ Kimi K2 ของ Moonshot และครองตำแหน่ง Qwen33 ของ Alibaba ด้วยอัตราความสำเร็จ 80.8% Z.AI ยังรายงานอัตราความสำเร็จในการเรียกใช้เครื่องมือที่ 90.6%ซึ่งสูงที่สุดในหมู่เพื่อน ๆ แสดงให้เห็นถึงความน่าเชื่อถือที่เหนือกว่าสำหรับงานการเข้ารหัสตัวแทน วิถีเต็มรูปแบบสำหรับการทดสอบเหล่านี้คือ เปิดเผยต่อสาธารณะ Sonnet Gemini 2.5 Pro Deepseek-R1-0528 KIMI K2 SWE-BENCH VERIFIED 1 64.2 57.6 69.1 48.6 67.8 70.4 49.0 41.4 65.4 เทอร์มินัล 2 37.5 30 30.2 30.3 43.2 35.5 25.5 25.5 การวิเคราะห์ชายแดน Pareto ที่ดำเนินการโดย Z.AI แสดงให้เห็นว่าทั้ง GLM-4.5 และ GLM-4.5-Air นั่งอยู่บนขอบเขตการแลกเปลี่ยนที่ดีที่สุดสำหรับประสิทธิภาพและมาตราส่วนของโมเดล สิ่งนี้บ่งชี้ว่าแบบจำลองได้รับผลลัพธ์ระดับสูงสุดโดยไม่ต้องมีค่าใช้จ่ายในการคำนวณของคู่แข่งที่มีประสิทธิภาพในทำนองเดียวกันการตอกย้ำการมุ่งเน้นเชิงกลยุทธ์ของ บริษัท ในการส่งมอบทั้งประสิทธิภาพสูงและประสิทธิภาพที่คุ้มค่า
การแข่งขันที่รุนแรงที่สุดของจีน Z.AI กำลังตัดราคาคู่แข่งอย่างชัดเจนในราคา บริษัท จะคิดค่าใช้จ่าย 11 เซนต์ต่อล้านโทเค็นอินพุตสำหรับ GLM-4.5 เมื่อเทียบกับค่าใช้จ่ายลึก 14 เซนต์สำหรับรุ่น R1
ราคาก้าวร้าวนี้ยังคงเป็นแนวโน้มที่ทำให้ภาค AI Deepseek ได้รับความโดดเด่นด้วยการให้บริการในราคาเพียงเล็กน้อยของค่าใช้จ่ายของโมเดลของ Openai ตอนนี้ Z.AI กำลังทวีความรุนแรงมากขึ้นเมื่อสงครามบังคับให้ บริษัท ต้องแข่งขันกับประสิทธิภาพไม่ใช่แค่พลังดิบ
ตามเกณฑ์มาตรฐานของ Z.ai, GLM-4.4.5 แข่งขันได้ดีกับรุ่นชั้นนำจาก Openai, Google และมานุษยวิทยา ทุ่นระเบิด
ความก้าวหน้าทางเทคนิคของ Z.ai ถูกตั้งค่าไว้กับฉากหลังของแรงกดดันทางการเมืองที่รุนแรง บริษัท ภายใต้ชื่อ zhipu เดิมคือ
สภาพแวดล้อมนี้ทำให้ บริษัท จีน การพึ่งพาชิป H20 ของ NVIDIA เป็นผลมาจากการควบคุมการส่งออกของสหรัฐฯโดยตรงเพื่อชะลอความทะเยอทะยาน AI ของจีน กระนั้นซีอีโอซีอีโอ Zhang Peng บอกกับ CNBC ว่า บริษัท มีพลังการคำนวณเพียงพอโดยระบุว่า“ บริษัท ไม่จำเป็นต้องซื้อชิปมากขึ้นเนื่องจากมีพลังคอมพิวเตอร์เพียงพอสำหรับตอนนี้”
เวลาก็สำคัญเช่นกัน การเปิดตัวของ Z.AI นั้นมาจากโมเมนตัมของ Deepseek ได้หยุดชะงัก รุ่น R2 ที่คาดว่าจะสูงของ บริษัท นั้นล่าช้าอย่างไม่มีกำหนดส่วนหนึ่งเป็นผลมาจากการขาดแคลนฮาร์ดแวร์ Z.AI ได้ออกแบบโมเดลเพื่อนำทาง
เผ่าพันธุ์ระดับโลกสำหรับอำนาจสูงสุดของตัวแทน
การมุ่งเน้นไปที่ เป้าหมายคือการก้าวข้ามแชทบอทที่ตอบคำถามให้กับตัวแทนอิสระที่ทำงานให้เสร็จสมบูรณ์ แนวโน้มนี้ได้รับการตรวจสอบแล้วในโลกของ บริษัท
ธนาคารเพื่อการลงทุน Goldman Sachs เช่นกำลังนำร่อง AI เพื่อสร้าง“ แรงงานลูกผสม” หัวหน้าฝ่ายเทคโนโลยีมาร์โกอาร์เจนติอธิบายวิสัยทัศน์โดยกล่าวว่า“ มันเกี่ยวกับผู้คนและการทำงานเคียงข้างกันจริง ๆ วิศวกรจะได้รับการคาดหวังว่าจะมีความสามารถในการอธิบายปัญหาอย่างแท้จริงในทางที่สอดคล้องกัน…” สิ่งนี้สะท้อนให้เห็นถึงอนาคตที่มนุษย์ดูแล AI ไม่ใช่แค่ใช้มันเป็นเครื่องมือ Alibaba เพิ่งเปิดตัว Qwen3-Coder และ Moonshot AI เปิดตัวรุ่น Kimi K2 ซึ่งทั้งคู่กำหนดเป้าหมายความสามารถของตัวแทน แม้แต่ Sam Altman ของ Openai ก็ยอมรับแรงกดดันจากการแข่งขันจากประเทศจีนโดยสัญญาว่าเมื่อต้นปีที่ผ่านมา“ เราจะส่งมอบแบบจำลองที่ดีขึ้นอย่างเห็นได้ชัด การรับเลี้ยงบุตรบุญธรรม วิธีการนี้เชิญชวนการทำงานร่วมกันทั่วโลกแม้ในขณะที่ความตึงเครียดทางการเมืองเพิ่มขึ้น