NVIDIA heeft open-Rasioning-Nemotron uitgebracht, een nieuwe familie van krachtige en efficiënte open-source AI-modellen. Aangekondigd op 19 juli 2025, en Gerwally beschikbaar via Hugging Face De modellen hebben nieuwe prestaties voor redenen ingesteld in wiskunde. door destillatie van de capaciteiten uit het enorme 671B R1-0528-model van Deepseek, een van de beste AI-systemen van China. Deze strategie biedt ontwikkelaars gratis, commercieel permissieve toegang tot state-of-the-art redeneren ai.
De release is bedoeld om geavanceerde mogelijkheden te democratiseren, waardoor ze beschikbaar zijn in 1,5B, 7B, 14B en 32B parameterafmetingen. Dit voorkomt de noodzaak van computer-schaalcomputer, deuren openen voor kleinere teams en onderzoekers.
Distillering van kracht van een Frontier-model
in de kern van open-Rasioning-Nemotron is een verfijnde destillatiestrategie. Nvidia maakte gebruik van het onlangs verbeterde Deepseek-R1-0528-model, een 671 miljard parameter krachtpatser, om kleinere modellen zijn geavanceerde redeneervaardigheden te leren.
Dit werd bereikt door training op een samengestelde dataset van 5 miljoen hoogwaardige redeneringsonderzoekers die worden gegenereerd door het diepeekmodel. Het proces wordt gegeneraliseerd redeneervermogen overgebracht naar meer compacte architecturen op basis van het QWEN 2.5-framework van Alibaba.
De resultaten zijn indrukwekkend. Volgens de benchmarks van Nvidia stellen de Nemotron-modellen nieuwe state-of-the-art pass@1 scores op voor hun grootteklassen. Het 32B-model scoort bijvoorbeeld 89.2 op AIME24 en 70.2 op Livecodebench zonder speciale afstemming.
Voor nog meer veeleisende taken introduceerde Nvidia een”zware”modus met behulp van een techniek genaamd generatieve selectie (genSelect). Deze methode genereert meerdere potentiële oplossingen en gebruikt het model om de beste te selecteren, Signanty Boosting Accuracy on Complex Problemen . Op de hmmt februari 2025 Math Benchmark springt van 73.8 naar een ongelooflijke 96.7, die krachtige opkomende redeneermogelijkheden op schaal aantoont.