NVIDIA เปิดตัว Rubin CPX ซึ่งเป็น GPU พิเศษเพื่อเร่งการอนุมาน AI สมรรถนะยาว

Nvidia ได้เปิดตัว Rubin CPX ซึ่งเป็นคลาสใหม่ของ GPU ที่สร้างขึ้นเพื่อเร่ง”เฟสบริบท”ที่ต้องคำนวณอย่างเข้มข้นของการอนุมาน AI ประกาศในวันนี้ชิปได้รับการออกแบบมาเพื่อจัดการกับปริมาณงานขนาดใหญ่ที่มีโทเค็นมากกว่าหนึ่งล้านรายการเช่นการสร้างวิดีโอและการวิเคราะห์รหัสขนาดใหญ่

นวัตกรรมทางสถาปัตยกรรมนี้ซึ่ง Nvidia เรียกว่า Rubin CPX เป็นส่วนหนึ่งของแพลตฟอร์ม Vera Rubin ที่กำลังจะมาถึงซึ่งเป็นครั้งแรกที่ GTC 2025 และคาดว่าในช่วงปลายปี 2026

ย้าย สร้างหมวดหมู่ฮาร์ดแวร์พิเศษใหม่ที่มีวัตถุประสงค์เพื่อปรับปรุงการทำกำไรของโรงงาน AI นอกจากนี้ยังขยายขอบเขตการปกครองของ Nvidia เหนือคู่แข่งหลายคนยังคงดิ้นรนเพื่อพัฒนาทางเลือกที่มีวัตถุประสงค์ทั่วไป

เฟส prefill ที่คำนวณได้อย่างหนักอาจทำให้เกิดความล่าช้าได้นาน-บางครั้งนาทีก่อนที่โทเค็นแรกของการตอบสนองจะปรากฏขึ้น จากข้อมูลของ Shar Narasimhan ผู้อำนวยการผลิตภัณฑ์ที่ Nvidia GPU อเนกประสงค์เดียวถูกบังคับให้จัดการงานทั้งสองเมื่อมันได้รับการปรับให้เหมาะสมอย่างแท้จริงสำหรับหนึ่งเดียวสร้างการประนีประนอมทางสถาปัตยกรรม แนวคิดหลักคือการประมวลผลขั้นตอนเหล่านี้อย่างอิสระช่วยให้สามารถเพิ่มประสิทธิภาพเป้าหมายของทรัพยากรการคำนวณและหน่วยความจำได้

โดยการกำหนดเฟสบริบทการคำนวณที่กำหนดให้กับโปรเซสเซอร์พิเศษ NVIDIA อ้างว่าวิธีการ ปรับปรุงการรับส่ง Nvidia ได้พิสูจน์พลังของกลยุทธ์ในซอฟต์แวร์แล้วโดยใช้เลเยอร์ Dynamo Orchestration เพื่อกำหนดเส้นทางงานอย่างชาญฉลาดผ่านฮาร์ดแวร์แบล็กเวลล์ที่มีอยู่

การกระจายตัวของซอฟต์แวร์นี้เป็นจุดสำคัญใน การตั้งค่าบันทึกประสิทธิภาพใหม่ ตอนนี้ Rubin CPX แสดงให้เห็นถึงการรวมตัวกันทางกายภาพของกลยุทธ์ที่ได้รับการพิสูจน์แล้วการย้ายจากการเพิ่มประสิทธิภาพซอฟต์แวร์ไปยังซิลิกอนที่สร้างขึ้นโดยวัตถุประสงค์

การมุ่งเน้นไปที่สัญญาณฮาร์ดแวร์พิเศษการเจริญเติบโตของตลาด มันเคลื่อนที่เกินกว่าเพียงแค่เพิ่มพลังดิบให้กับการออกแบบชิปเดียวและไปสู่การเพิ่มประสิทธิภาพที่ซับซ้อนและเต็มไปด้วยการทำงานเต็มรูปแบบของเวิร์กโฟลว์ AI ทั้งหมด T

เป็นหลักสำคัญของวิสัยทัศน์”AI Factory”ของ บริษัท ที่เพิ่มประสิทธิภาพและผลตอบแทนการลงทุนสูงสุดเป็นเป้าหมายสูงสุด

ภายใต้ประทุน: Rubin CPX และ Vera Rubin Nvl144 สำหรับเฟสบริบท มันให้การคำนวณ NVFP4 30 petaflops ที่น่าเกรงขามและติดตั้งหน่วยความจำ GDDR7 128GB

ตาม Nvidia นี่เป็นตัวเลือกการออกแบบโดยเจตนาและคุ้มค่า โดยการเลือกใช้ GDDR7 ผ่านหน่วยความจำแบนด์วิดธ์สูงที่มีราคาแพงกว่า (HBM) โดยทั่วไปจะใช้ใน GPU ที่เน้นการสร้างรุ่น บริษัท สามารถให้ประสิทธิภาพที่เพียงพอสำหรับงาน prefill ที่มีการคำนวณที่มีการคำนวณในขณะที่การปรับปรุงผลตอบแทนโดยรวมของระบบ

href=”https://developer.nvidia.com/blog/nvidia-rubin-cpx-Accelerates-enference-performance-and-efficience-for-token-context-workloads/”targoal=”_ blank”> การเร่งความเร็วที่เร็วขึ้น ตัวชี้วัดเนื่องจากกลไกความสนใจเป็นหัวใจเชิงคำนวณของแบบจำลองหม้อแปลง การเร่งความเร็วเป็นสิ่งจำเป็นสำหรับการประมวลผลลำดับข้อมูลที่ยาวมากที่พบในบริบทนับล้าน

GPU ยังรวมถึงการสนับสนุนฮาร์ดแวร์เฉพาะสำหรับการถอดรหัสวิดีโอและการเข้ารหัสการตอบสนองความต้องการของแอปพลิเคชั่นที่มีค่าใช้จ่ายสูง แพลตฟอร์มการให้บริการที่มีประสิทธิภาพสูงซึ่งตั้งอยู่ในชั้นวางเดียว

ระบบบูรณาการเป็นโรงไฟฟ้ารวม 144 Rubin CPX GPU สำหรับการประมวลผลบริบท 144 Rubin GPU มาตรฐานสำหรับเฟสการสร้างและ 36 Vera CPU การกำหนดค่านี้ให้พลังการคำนวณ NVFP4 ทั้งหมด 8 ครั้งเพิ่มขึ้น 7.5 เท่าของ GB300 NVL72 ที่น่ากลัวอยู่แล้ว

ข้อกำหนดระดับระบบที่น่าประทับใจเท่ากันโดยมีหน่วยความจำความเร็วสูง 100TB ชั้นวางทั้งหมดเชื่อมต่อกับ Ethernet Quantum-X800 Infiniband หรือ Spectrum-X Ethernet และจัดเตรียมโดยแพลตฟอร์มซอฟต์แวร์ Nvidia Dynamo

สำหรับลูกค้าที่นำแพลตฟอร์ม Rubin มาตรฐานมาใช้ก่อนที่จะมีการติดตั้ง CPX แพลตฟอร์มเต็มคาดว่าจะวางจำหน่ายในตอนท้ายของปี 2026

ขยายความเป็นผู้นำ: Nvidia เพิ่มความเข้มข้นของคูเมืองที่แข่งขันได้

การประกาศนี้เป็นช่วงเวลาที่ยากลำบากสำหรับคู่แข่งของ Nvidia อุตสาหกรรมเทคโนโลยีทั้งหมดกำลังแข่งเพื่อพัฒนาตัวเร่งความเร็ว AI ที่เป็นกรรมสิทธิ์ตั้งแต่ชิปฝึกอบรมของ Amazon ไปจนถึงโปรเซสเซอร์ MTIA ของ Meta แต่หลายคนต้องดิ้นรนกับความยากลำบากอย่างมากของการออกแบบชิป

Microsoft ได้เผชิญหน้ากับความพ่ายแพ้ที่สำคัญกับโครงการซิลิคอนในบ้านโดยมีรายงานว่าชิป’Braga’ล่าช้าและมีประสิทธิภาพต่ำกว่า ในขณะที่คู่แข่งยังคงพยายามที่จะสร้าง GPU เดียวเพื่อให้ตรงกับประสิทธิภาพทั่วไปของ Nvidia ผู้นำตลาดกำลังแบ่งพื้นที่ปัญหากับโปรเซสเซอร์ร่วมพิเศษ

แม้แต่คู่แข่งโดยตรง AMD ซึ่งเพิ่งเปิดตัวการโจมตีโดยตรงกับ Instinct MI350 ซีรีส์ วิธีการที่แยกออกจาก Nvidia แสดงให้เห็นถึงปรัชญาสถาปัตยกรรมที่แตกต่างกันโดยพื้นฐาน

กลยุทธ์ดูเหมือนจะสะท้อนความเชื่อมั่นก่อนหน้านี้โดย Jensen Huang ซีอีโอของ Nvidia ซึ่งครั้งหนึ่งเคยถามว่า กำลังตอกย้ำความเป็นผู้นำของตลาด

Shar Narasimhan ผู้อำนวยการผลิตภัณฑ์ของ Nvidia กล่าวว่าสถาปัตยกรรมใหม่“ จะเพิ่มประสิทธิภาพและประสิทธิภาพของโรงงาน AI อย่างมาก” ด้วยการมาถึงที่กำหนดไว้สำหรับปลายปี 2569 Nvidia ไม่ได้เป็นเพียงการสร้างชิป มันเป็นสถาปัตยกรรมในอนาคตของศูนย์ข้อมูล AI ซึ่งเป็นองค์ประกอบพิเศษหนึ่งรายการในแต่ละครั้ง

Categories: IT Info

Search for:

Lastest News and Guides

FTC เปิดตัวโพรบที่สำคัญในความปลอดภัยของ AI Chatbot สำหรับวัยรุ่นโดยกำหนดเป้าหมายไปที่ Google, Meta และ Openai

Meta ขยายโน้ตชุมชนตอนนี้จะแจ้งเตือนผู้ใช้ที่มีปฏิสัมพันธ์กับโพสต์ที่ถูกต้อง

กลยุทธ์ SEO ท้องถิ่นสำหรับธุรกิจขนาดเล็ก: ขั้นตอนการปฏิบัติสำหรับผลลัพธ์ที่ยิ่งใหญ่

วิธีเปิดใช้งานที่อยู่ฮาร์ดแวร์แบบสุ่มใน Windows 11 (การสุ่ม MAC)

แก้ไขปฏิทิน Windows 11 ไม่เปิดจากแถบงาน

AI เปลี่ยนคลิปเบลอเป็นภาพ 4K ที่น่าทึ่งได้อย่างไร

AI เปลี่ยนคลิปเบลอเป็นภาพ 4K ที่น่าทึ่งได้อย่างไร

NVIDIA เปิดตัว Rubin CPX ซึ่งเป็น GPU พิเศษเพื่อเร่งการอนุมาน AI สมรรถนะยาว

Published by All Things Windows on September 9, 2025

ขยายความเป็นผู้นำ: Nvidia เพิ่มความเข้มข้นของคูเมืองที่แข่งขันได้

Related Posts

IT Info

FTC เปิดตัวโพรบที่สำคัญในความปลอดภัยของ AI Chatbot สำหรับวัยรุ่นโดยกำหนดเป้าหมายไปที่ Google, Meta และ Openai

IT Info

Meta ขยายโน้ตชุมชนตอนนี้จะแจ้งเตือนผู้ใช้ที่มีปฏิสัมพันธ์กับโพสต์ที่ถูกต้อง

IT Info

กลยุทธ์ SEO ท้องถิ่นสำหรับธุรกิจขนาดเล็ก: ขั้นตอนการปฏิบัติสำหรับผลลัพธ์ที่ยิ่งใหญ่