Nvidia ได้เข้าสู่สนามกีฬา AI ขนาดเล็กที่แข่งขันได้ด้วยการเปิดตัว Nemotron-Nano-9B-V2 ซึ่งเป็นโมเดลโอเพ่นซอร์ส 9 พันล้านพารามิเตอร์ที่ทรงพลังและมีประสิทธิภาพ พร้อมใช้งานตอนนี้รุ่นนี้มีสถาปัตยกรรมไฮบริด Mamba-Transformer ใหม่ที่ออกแบบมาสำหรับปริมาณงานสูงใน GPU เดียว
คุณสมบัติที่โดดเด่นของมันเป็นระบบการให้เหตุผลที่ไม่เหมือนใครซึ่งช่วยให้นักพัฒนาสามารถควบคุมกระบวนการ”คิด”ของโมเดล การเปิดตัวตำแหน่ง Nvidia ในฐานะผู้เล่นหลักในตลาดที่กำลังเติบโตสำหรับ AI ขนาดเล็กที่เป็นมิตรกับการค้าที่ท้าทายโดยตรงกับนวัตกรรมล่าสุด
การย้ายครั้งนี้ส่งสัญญาณการผลักดันเชิงกลยุทธ์ในพื้นที่รูปแบบภาษาขนาดเล็ก (SLM) ที่กำลังขยายตัว ในขณะที่อุตสาหกรรมต่อสู้กับค่าใช้จ่ายสูงของรุ่นชายแดนความต้องการทางเลือกที่มีประสิทธิภาพ แต่มีความสามารถเพิ่มขึ้น รายการของ Nvidia ท้าทายการเผยแพร่ล่าสุดจากคู่แข่งเช่น Alibaba และ Deepseek
การมุ่งเน้นไปที่ A10 GPU ที่เน้นย้ำถึงกลยุทธ์ของ Nvidia ในวงกว้าง โมเดลถูกตัดแต่งเพื่อให้พอดีกับชิป A10 โดยเฉพาะ
เรารู้สึกตื่นเต้นที่จะแบ่งปันการเปิดลีดเดอร์บอร์ด🏆 nvidia nemotron nano 2 ซึ่งเป็นพารามิเตอร์ 9B ที่ก้าวล้ำเปิดแบบจำลองการใช้เหตุผลหลายภาษา href=”https://twitter.com/artificialanlys?ref_src=twsrc%5Etfw”target=”_ blank”>@artificialanlys ลีดเดอร์ลีดเดอร์อัจฉริยะในหมู่โมเดลเปิดภายใน… target=”_ blank”> pic.twitter.com/zs5gtdzjsk
-นักพัฒนา Nvidia AI (@nvidiaaidev)
เกินขนาดที่มีประสิทธิภาพโมเดลมีหน้าต่างบริบท 128K ขนาดใหญ่ทำให้สามารถประมวลผลและให้เหตุผลมากกว่าเอกสารที่กว้างขวาง นอกจากนี้ยังมีความหลากหลายสูงการจัดการหลายภาษารวมถึงภาษาอังกฤษเยอรมันสเปนและญี่ปุ่นและมีความเชี่ยวชาญในการเรียนการสอนที่ซับซ้อนและการสร้างรหัสตาม Nvidia
ประสิทธิภาพของโมเดลในการวัดมาตรฐานอุตสาหกรรมที่สำคัญ ใน รายงานทางเทคนิคอย่างเป็นทางการ ในการใช้เหตุผลที่ซับซ้อนจะได้รับ 72.1% สำหรับ AIME25 และ 64.0% สำหรับ GPQA สำหรับการแก้ปัญหาทางคณิตศาสตร์มันทำคะแนนได้ 97.8% ที่น่าประทับใจสำหรับ Math500
ความสามารถของมันขยายไปสู่การพัฒนาซอฟต์แวร์และการปฏิบัติตามคำแนะนำ โมเดลได้คะแนน 71.1% ในการประเมินการเข้ารหัส LiveCodeBench และแสดงให้เห็นถึงการทำความเข้าใจบริบทที่ยาวนานอย่างแข็งแกร่งด้วย 78.9% สำหรับการทดสอบไม้บรรทัด 128K ในการเรียนการสอนต่อไปนี้ถึง 90.3% จาก IFEVAL แสดงความน่าเชื่อถือ
ผลลัพธ์เหล่านี้มีความสำคัญเนื่องจากพวกเขาวาง Nemotron-Nano-9B-V2 ก่อนคู่แข่งโดยตรง ทั่วทั้งกระดานมาตรฐานแสดงความแม่นยำสูงกว่า QWEN3-8B ของอาลีบาบาซึ่งเป็นจุดเปรียบเทียบทั่วไปในพื้นที่ SLM สิ่งนี้สร้าง Nemotron-Nano เป็นตัวเลือกใหม่ที่น่าเกรงขามสำหรับนักพัฒนาที่กำลังมองหาประสิทธิภาพระดับสูงในแพ็คเกจขนาดกะทัดรัดและมีประสิทธิภาพ
สถาปัตยกรรมไฮบริดและการให้เหตุผลที่ควบคุมได้
href=”https://research.nvidia.com/labs/adlr/nvidia-nemotron-nano-2/”target=”_ blank”> สถาปัตยกรรมไฮบริด mamba-transformer ที่ซับซ้อน
การออกแบบนี้เป็นการตอบสนองโดยตรงต่อข้อ จำกัด ของแบบจำลองภาษาขนาดใหญ่แบบดั้งเดิม LLM ที่ได้รับความนิยมมากที่สุดคือโมเดล”หม้อแปลง”บริสุทธิ์ซึ่งขึ้นอยู่กับเลเยอร์ความสนใจทั้งหมด ในขณะที่ทรงพลังเลเยอร์เหล่านี้มีค่าใช้จ่ายสูงมากในหน่วยความจำและคำนวณความยาวของลำดับข้อความเพิ่มขึ้นปัญหาที่ปรับขนาดกำลังสองเพื่อแก้ปัญหานี้ Nemotron-Nano ถูกสร้างขึ้นบน Nemotron-H ซึ่งเป็นแบบจำลองที่หลอมรวมสถาปัตยกรรมหม้อแปลงมาตรฐาน MAMBA รวมตัวแบบจำลองพื้นที่รัฐที่เลือก (SSMS) ซึ่งสามารถประมวลผลข้อมูลที่ยาวนานมากโดยการรักษาสถานะต่อเนื่องทำให้พวกเขาสามารถปรับขนาดเป็นเส้นตรงด้วยความยาวลำดับ
วิธีการไฮบริดนี้ให้ประสิทธิภาพที่เพิ่มขึ้นอย่างมาก ด้วยการแทนที่กลไกความสนใจที่มีค่าใช้จ่ายส่วนใหญ่ด้วยเลเยอร์พื้นที่สถานะเชิงเส้นเวลาเหล่านี้โมเดลสามารถบรรลุปริมาณงานที่สูงขึ้นถึงหกเท่าในบริบทที่ยาวนานเมื่อเทียบกับโมเดลหม้อแปลงขนาดใหญ่ในทำนองเดียวกันโดยไม่มีความแม่นยำลดลงอย่างมีนัยสำคัญ สิ่งนี้ทำให้เหมาะสำหรับงานที่เกี่ยวข้องกับเอกสารที่ยาวนานหรือประวัติการแชทที่กว้างขวาง
นอกเหนือจากสถาปัตยกรรมที่มีประสิทธิภาพ Nemotron-Nano แนะนำระบบใหม่สำหรับการจัดการกระบวนการแก้ปัญหา โมเดลเริ่มต้นเพื่อสร้างการติดตามการใช้เหตุผลก่อนที่จะให้คำตอบสุดท้าย แต่นักพัฒนาสามารถใช้โทเค็นควบคุมง่าย ๆ เช่น `/Think` เพื่อขอกระบวนการทีละขั้นตอนนี้อย่างชัดเจนหรือ`/no_think` เพื่อหลีกเลี่ยงการตอบกลับที่เร็วขึ้น สิ่งนี้จะช่วยให้นักพัฒนาสามารถปิดโทเค็นจำนวนโมเดลที่อุทิศให้กับการใช้เหตุผลภายในก่อนที่จะตอบกลับ กลไกนี้ให้คันโยกที่สำคัญสำหรับการปรับสมดุลความแม่นยำด้วยความหน่วงแฝงซึ่งเป็นข้อกังวลสำคัญในการผลิตเช่นการสนับสนุนลูกค้าหรือตัวแทนอิสระที่ความเร็วการตอบสนองเป็นสิ่งสำคัญ
เอกสารของ Nvidia แสดงให้เห็นถึงความแม่นยำของเส้นโค้ง คุณลักษณะนี้ได้รับการออกแบบมาอย่างจงใจในระหว่างการฝึกอบรมหลังการฝึกอบรมซึ่งประมาณ 5% ของข้อมูลมีร่องรอยการใช้เหตุผลที่ถูกตัดทอนทำให้สามารถควบคุมงบประมาณได้อย่างละเอียดในเวลาอนุมาน
เปิดสำหรับธุรกิจ: ใบอนุญาตที่อนุญาตและชุดข้อมูลขนาดใหญ่ ของตัวเอง อนุญาตให้ NVIDIA เปิดตัว ใบอนุญาตได้รับการออกแบบอย่างชัดเจนให้เป็นมิตรในเชิงพาณิชย์โดยระบุว่ารุ่นนั้นสามารถใช้งานได้ในเชิงพาณิชย์นอกกรอบ สิ่งนี้ช่วยให้องค์กรสามารถดาวน์โหลดแก้ไขและปรับใช้แบบจำลองได้อย่างอิสระในการผลิตทันทีโดยไม่ต้องเจรจาใบอนุญาตแยกต่างหากหรือค่าธรรมเนียมการชำระเงินที่เชื่อมโยงกับการใช้งานรายได้หรือจำนวนผู้ใช้
ที่สำคัญ Nvidia ไม่ได้เรียกร้องความเป็นเจ้าของ วิธีการเปิดนี้ยืนอยู่ตรงข้ามกับใบอนุญาตแบบเปิดจากผู้ให้บริการรายอื่นซึ่งมักจะต้องมีข้อตกลงที่ต้องชำระเงินเมื่อ บริษัท มีระดับที่กำหนด นักพัฒนายังมีอิสระในการสร้างและแจกจ่ายแบบจำลองอนุพันธ์เสริมสร้างระบบนิเวศการทำงานร่วมกัน
ใบอนุญาตนั้นรวมถึงเงื่อนไขมาตรฐานหลายประการที่มุ่งเน้นการใช้งานที่รับผิดชอบ องค์กรจะต้องไม่ข้ามรั้วความปลอดภัยในตัวโดยไม่ต้องใช้การเปลี่ยนที่เปรียบเทียบได้ การแจกจ่ายแบบจำลองใด ๆ หรืออนุพันธ์ของมันจะต้องมีข้อความใบอนุญาตและการระบุแหล่งที่มาที่เหมาะสม นอกจากนี้การใช้งานจะต้องปฏิบัติตามกฎระเบียบทางการค้าและสอดคล้องกับแนวทาง AI ที่น่าเชื่อถือของ Nvidia และประโยคการดำเนินคดีปกป้องระบบนิเวศโดยการยกเลิกใบอนุญาตสำหรับผู้ใช้ที่ฟ้องผู้อื่นในเรื่องการละเมิดโดยรุ่นส่วนใหญ่ Massive
ชุดข้อมูลนี้ถูกจัดเป็นสี่หมวดหมู่คีย์ มันมีชุดข้อมูลที่มุ่งเน้นทางคณิตศาสตร์ที่สร้างขึ้นด้วยไปป์ไลน์ใหม่เพื่อรักษาสมการที่ซับซ้อนชุดข้อมูลโค้ดขนาดใหญ่จาก GitHub ด้วยการกรองหลายขั้นตอนและชุดข้อมูลที่สร้างขึ้นแบบสังเคราะห์ซึ่งครอบคลุมต้นกำเนิดทางวิชาการและโดเมนการใช้เหตุผล นอกจากนี้ยังมีการรวบรวมข้อมูลเว็บ Nemotron-CC เวอร์ชันใหม่ที่ได้รับการปรับปรุงด้วยคู่คำถามและคำตอบที่แปลเป็น 15 ภาษาเพื่อรองรับความสามารถในการพูดได้หลายภาษาที่แข็งแกร่ง
รุ่นและชุดข้อมูลของมันพร้อมใช้งานสำหรับ
และผ่าน Catalog ของ Nvidia ด้วยการจัดหาแบบจำลองที่ทรงพลังไม่เพียง แต่ยังรวมถึงข้อมูลที่มีคุณภาพสูงและมีคุณภาพสูงที่ได้รับการฝึกฝน NVIDIA นำเสนอชุดเครื่องมือที่ครอบคลุม กลยุทธ์นี้มีจุดมุ่งหมายเพื่อเพิ่มขีดความสามารถให้กับนักพัฒนาและเร่งนวัตกรรมโดยมอบเครื่องมือสำหรับประสิทธิภาพสูงและประสิทธิภาพการปรับใช้ดาวน์โหลดบนใบหน้ากอด