Nvidia ได้เปิดตัว Rubin CPX ซึ่งเป็นคลาสใหม่ของ GPU ที่สร้างขึ้นเพื่อเร่ง”เฟสบริบท”ที่ต้องคำนวณอย่างเข้มข้นของการอนุมาน AI ประกาศในวันนี้ชิปได้รับการออกแบบมาเพื่อจัดการกับปริมาณงานขนาดใหญ่ที่มีโทเค็นมากกว่าหนึ่งล้านรายการเช่นการสร้างวิดีโอและการวิเคราะห์รหัสขนาดใหญ่
นวัตกรรมทางสถาปัตยกรรมนี้ซึ่ง Nvidia เรียกว่า Rubin CPX เป็นส่วนหนึ่งของแพลตฟอร์ม Vera Rubin ที่กำลังจะมาถึงซึ่งเป็นครั้งแรกที่ GTC 2025 และคาดว่าในช่วงปลายปี 2026
ย้าย สร้างหมวดหมู่ฮาร์ดแวร์พิเศษใหม่ที่มีวัตถุประสงค์เพื่อปรับปรุงการทำกำไรของโรงงาน AI นอกจากนี้ยังขยายขอบเขตการปกครองของ Nvidia เหนือคู่แข่งหลายคนยังคงดิ้นรนเพื่อพัฒนาทางเลือกที่มีวัตถุประสงค์ทั่วไป

เฟส prefill ที่คำนวณได้อย่างหนักอาจทำให้เกิดความล่าช้าได้นาน-บางครั้งนาทีก่อนที่โทเค็นแรกของการตอบสนองจะปรากฏขึ้น จากข้อมูลของ Shar Narasimhan ผู้อำนวยการผลิตภัณฑ์ที่ Nvidia GPU อเนกประสงค์เดียวถูกบังคับให้จัดการงานทั้งสองเมื่อมันได้รับการปรับให้เหมาะสมอย่างแท้จริงสำหรับหนึ่งเดียวสร้างการประนีประนอมทางสถาปัตยกรรม แนวคิดหลักคือการประมวลผลขั้นตอนเหล่านี้อย่างอิสระช่วยให้สามารถเพิ่มประสิทธิภาพเป้าหมายของทรัพยากรการคำนวณและหน่วยความจำได้
โดยการกำหนดเฟสบริบทการคำนวณที่กำหนดให้กับโปรเซสเซอร์พิเศษ NVIDIA อ้างว่าวิธีการ ปรับปรุงการรับส่ง Nvidia ได้พิสูจน์พลังของกลยุทธ์ในซอฟต์แวร์แล้วโดยใช้เลเยอร์ Dynamo Orchestration เพื่อกำหนดเส้นทางงานอย่างชาญฉลาดผ่านฮาร์ดแวร์แบล็กเวลล์ที่มีอยู่
การกระจายตัวของซอฟต์แวร์นี้เป็นจุดสำคัญใน การตั้งค่าบันทึกประสิทธิภาพใหม่ ตอนนี้ Rubin CPX แสดงให้เห็นถึงการรวมตัวกันทางกายภาพของกลยุทธ์ที่ได้รับการพิสูจน์แล้วการย้ายจากการเพิ่มประสิทธิภาพซอฟต์แวร์ไปยังซิลิกอนที่สร้างขึ้นโดยวัตถุประสงค์
การมุ่งเน้นไปที่สัญญาณฮาร์ดแวร์พิเศษการเจริญเติบโตของตลาด มันเคลื่อนที่เกินกว่าเพียงแค่เพิ่มพลังดิบให้กับการออกแบบชิปเดียวและไปสู่การเพิ่มประสิทธิภาพที่ซับซ้อนและเต็มไปด้วยการทำงานเต็มรูปแบบของเวิร์กโฟลว์ AI ทั้งหมด T
เป็นหลักสำคัญของวิสัยทัศน์”AI Factory”ของ บริษัท ที่เพิ่มประสิทธิภาพและผลตอบแทนการลงทุนสูงสุดเป็นเป้าหมายสูงสุด
ภายใต้ประทุน: Rubin CPX และ Vera Rubin Nvl144 สำหรับเฟสบริบท มันให้การคำนวณ NVFP4 30 petaflops ที่น่าเกรงขามและติดตั้งหน่วยความจำ GDDR7 128GB
ตาม Nvidia นี่เป็นตัวเลือกการออกแบบโดยเจตนาและคุ้มค่า โดยการเลือกใช้ GDDR7 ผ่านหน่วยความจำแบนด์วิดธ์สูงที่มีราคาแพงกว่า (HBM) โดยทั่วไปจะใช้ใน GPU ที่เน้นการสร้างรุ่น บริษัท สามารถให้ประสิทธิภาพที่เพียงพอสำหรับงาน prefill ที่มีการคำนวณที่มีการคำนวณในขณะที่การปรับปรุงผลตอบแทนโดยรวมของระบบ
href=”https://developer.nvidia.com/blog/nvidia-rubin-cpx-Accelerates-enference-performance-and-efficience-for-token-context-workloads/”targoal=”_ blank”> การเร่งความเร็วที่เร็วขึ้น ตัวชี้วัดเนื่องจากกลไกความสนใจเป็นหัวใจเชิงคำนวณของแบบจำลองหม้อแปลง การเร่งความเร็วเป็นสิ่งจำเป็นสำหรับการประมวลผลลำดับข้อมูลที่ยาวมากที่พบในบริบทนับล้าน
GPU ยังรวมถึงการสนับสนุนฮาร์ดแวร์เฉพาะสำหรับการถอดรหัสวิดีโอและการเข้ารหัสการตอบสนองความต้องการของแอปพลิเคชั่นที่มีค่าใช้จ่ายสูง แพลตฟอร์มการให้บริการที่มีประสิทธิภาพสูงซึ่งตั้งอยู่ในชั้นวางเดียว
ระบบบูรณาการเป็นโรงไฟฟ้ารวม 144 Rubin CPX GPU สำหรับการประมวลผลบริบท 144 Rubin GPU มาตรฐานสำหรับเฟสการสร้างและ 36 Vera CPU การกำหนดค่านี้ให้พลังการคำนวณ NVFP4 ทั้งหมด 8 ครั้งเพิ่มขึ้น 7.5 เท่าของ GB300 NVL72 ที่น่ากลัวอยู่แล้ว
ข้อกำหนดระดับระบบที่น่าประทับใจเท่ากันโดยมีหน่วยความจำความเร็วสูง 100TB ชั้นวางทั้งหมดเชื่อมต่อกับ Ethernet Quantum-X800 Infiniband หรือ Spectrum-X Ethernet และจัดเตรียมโดยแพลตฟอร์มซอฟต์แวร์ Nvidia Dynamo
สำหรับลูกค้าที่นำแพลตฟอร์ม Rubin มาตรฐานมาใช้ก่อนที่จะมีการติดตั้ง CPX แพลตฟอร์มเต็มคาดว่าจะวางจำหน่ายในตอนท้ายของปี 2026
ขยายความเป็นผู้นำ: Nvidia เพิ่มความเข้มข้นของคูเมืองที่แข่งขันได้
การประกาศนี้เป็นช่วงเวลาที่ยากลำบากสำหรับคู่แข่งของ Nvidia อุตสาหกรรมเทคโนโลยีทั้งหมดกำลังแข่งเพื่อพัฒนาตัวเร่งความเร็ว AI ที่เป็นกรรมสิทธิ์ตั้งแต่ชิปฝึกอบรมของ Amazon ไปจนถึงโปรเซสเซอร์ MTIA ของ Meta แต่หลายคนต้องดิ้นรนกับความยากลำบากอย่างมากของการออกแบบชิป
Microsoft ได้เผชิญหน้ากับความพ่ายแพ้ที่สำคัญกับโครงการซิลิคอนในบ้านโดยมีรายงานว่าชิป’Braga’ล่าช้าและมีประสิทธิภาพต่ำกว่า ในขณะที่คู่แข่งยังคงพยายามที่จะสร้าง GPU เดียวเพื่อให้ตรงกับประสิทธิภาพทั่วไปของ Nvidia ผู้นำตลาดกำลังแบ่งพื้นที่ปัญหากับโปรเซสเซอร์ร่วมพิเศษ
แม้แต่คู่แข่งโดยตรง AMD ซึ่งเพิ่งเปิดตัวการโจมตีโดยตรงกับ Instinct MI350 ซีรีส์ วิธีการที่แยกออกจาก Nvidia แสดงให้เห็นถึงปรัชญาสถาปัตยกรรมที่แตกต่างกันโดยพื้นฐาน
กลยุทธ์ดูเหมือนจะสะท้อนความเชื่อมั่นก่อนหน้านี้โดย Jensen Huang ซีอีโอของ Nvidia ซึ่งครั้งหนึ่งเคยถามว่า กำลังตอกย้ำความเป็นผู้นำของตลาด
Shar Narasimhan ผู้อำนวยการผลิตภัณฑ์ของ Nvidia กล่าวว่าสถาปัตยกรรมใหม่“ จะเพิ่มประสิทธิภาพและประสิทธิภาพของโรงงาน AI อย่างมาก” ด้วยการมาถึงที่กำหนดไว้สำหรับปลายปี 2569 Nvidia ไม่ได้เป็นเพียงการสร้างชิป มันเป็นสถาปัตยกรรมในอนาคตของศูนย์ข้อมูล AI ซึ่งเป็นองค์ประกอบพิเศษหนึ่งรายการในแต่ละครั้ง