NVIDIA heeft open-Rasioning-Nemotron uitgebracht, een nieuwe familie van krachtige en efficiënte open-source AI-modellen. Aangekondigd op 19 juli 2025, en Gerwally beschikbaar via Hugging Face De modellen hebben nieuwe prestaties voor redenen ingesteld in wiskunde. door destillatie van de capaciteiten uit het enorme 671B R1-0528-model van Deepseek, een van de beste AI-systemen van China. Deze strategie biedt ontwikkelaars gratis, commercieel permissieve toegang tot state-of-the-art redeneren ai.

De release is bedoeld om geavanceerde mogelijkheden te democratiseren, waardoor ze beschikbaar zijn in 1,5B, 7B, 14B en 32B parameterafmetingen. Dit voorkomt de noodzaak van computer-schaalcomputer, deuren openen voor kleinere teams en onderzoekers.

Distillering van kracht van een Frontier-model

in de kern van open-Rasioning-Nemotron is een verfijnde destillatiestrategie. Nvidia maakte gebruik van het onlangs verbeterde Deepseek-R1-0528-model, een 671 miljard parameter krachtpatser, om kleinere modellen zijn geavanceerde redeneervaardigheden te leren.

Dit werd bereikt door training op een samengestelde dataset van 5 miljoen hoogwaardige redeneringsonderzoekers die worden gegenereerd door het diepeekmodel. Het proces wordt gegeneraliseerd redeneervermogen overgebracht naar meer compacte architecturen op basis van het QWEN 2.5-framework van Alibaba.

De resultaten zijn indrukwekkend. Volgens de benchmarks van Nvidia stellen de Nemotron-modellen nieuwe state-of-the-art pass@1 scores op voor hun grootteklassen. Het 32B-model scoort bijvoorbeeld 89.2 op AIME24 en 70.2 op Livecodebench zonder speciale afstemming.

Voor nog meer veeleisende taken introduceerde Nvidia een”zware”modus met behulp van een techniek genaamd generatieve selectie (genSelect). Deze methode genereert meerdere potentiële oplossingen en gebruikt het model om de beste te selecteren, Signanty Boosting Accuracy on Complex Problemen . Op de hmmt februari 2025 Math Benchmark springt van 73.8 naar een ongelooflijke 96.7, die krachtige opkomende redeneermogelijkheden op schaal aantoont.

De diepe validatie van de Chinese firma’s technologie van de Chinese firma’s technologie. Deepseek maakte golven in mei 2025 met zijn R1-0528-update, en beweerde dat de prestaties ervan”die van toonaangevende modellen benaderden, zoals O3 en Gemini 2.5 Pro,”van concurrenten zoals Openai en Google. In april 2025 noemde een US House Committee Deepseek een nationale veiligheidsrisico. Committee Chairman John Moolenaar issued a stark warning about the company.

He stated, “This report makes it clear: DeepSeek isn’t just another AI app — it’s a weapon in the Chinese Communist Party’s arsenal, designed to spy on Americans, steal our technology, and subvert U.S. law.”NVIDIA’s gebruik van het model benadrukt de onderling verbonden aard van de wereldwijde AI-ontwikkeling.

Nvidia heeft alle vier openRasing-Nemotron-modellen uitgebracht onder een commercieel permissief licentie . Ze zijn ontworpen voor eenvoudige integratie met tools zoals het NVIDIA NEMO Framework, Tensorrt-LLM en knuffelende gezichtstransformatoren, waardoor snelle implementatie wordt vergemakkelijkt.

door alleen begeleide verfijning (SFT) te gebruiken en te vermijden van versterking leren (RL), biedt Nvidia een sterke, stabiele baseline. Dit stelt de onderzoeksgemeenschap in staat om op deze modellen voort te bouwen om nieuwe RL-technieken te verkennen voor het redeneren, waardoor het hele veld mogelijk wordt versneld.

Categories: IT Info