Nvidia har gitt ut OpenReasoning-Nemotron, en ny familie med mektige og effektive Open-Source AI-modeller. Kunngjort 19. juli 2025, og Tilgjengelig globalt via Hugging Face
Utgivelsen tar sikte på å demokratisere avanserte evner, noe som gjør dem tilgjengelige i 1,5B, 7B, 14B og 32B parameterstørrelser. Dette unngår behovet for begrensningsressurser for grenser, åpner dører for mindre team og forskere.
Destillasjonskraft fra en grensemodell
Kjernen i OpenReasoning-Nemotron er en sofistikert destillasjonsstrategi. NVIDIA utnyttet den nylig oppgraderte DeepSeek-R1-0528-modellen, et parameterkraftverk på 671 milliarder dollar, for å lære mindre modeller sine avanserte resonnementferdigheter.
Dette ble oppnådd ved å trene på et kurert datasett på 5 millioner resonnement av høy kvalitet generert av DeepSeek-modellen. Prosessen overfører generalisert resonneringsevne til mer kompakte arkitekturer basert på Alibabas Qwen 2.5-ramme.
Resultatene er imponerende. I følge NVIDIAs benchmarks etablerer Nemotron-modellene nye topp moderne pasninger@1-score for størrelsesklassene. 32B-modellen, for eksempel, scorer 89,2 på AIME24 og 70,2 på LiveCodeBench uten spesiell innstilling.
For enda mer krevende oppgaver introduserte NVIDIA en”tung”modus ved bruk av en teknikk kalt generativt utvalg (Genselect). Denne metoden genererer flere potensielle løsninger og bruker modellen for å velge den beste, betydelig å øke gensen på komplekset. På HMMT feb 2025 hopper matematikkmark fra 73,8 til en utrolig 96,7, noe som demonstrerer kraftige fremvoksende resonnementfunksjoner i skala.
DeepSeek-tilkoblingen og geopolitisk kontekst
Denne fremgangen skjer midt intense geopolitiske overvind. I april 2025 merket en amerikansk husutvalg DeepSeek som en nasjonal sikkerhetsrisiko. Komiteens styreleder John Moolenaar ga ut en sterk advarsel om selskapet.
Han uttalte:”Denne rapporten gjør det klart: Deepseek er ikke bare en annen AI-app-det er et våpen i det kinesiske kommunistpartiets arsenal, designet for å spionere på amerikanere, stjele vår teknologi og underkjørt amerikansk lov.”NVIDIAs bruk av modellen fremhever den sammenkoblede naturen til global AI-utvikling.
Nvidia har gitt ut alle de fire openreasoning-nemotron-modeller under en
ved å bruke bare overvåket finjustering (SFT) og unngå forsterkningslæring (RL), NVIDIA gir en sterk, stabel basel. Dette gjør at forskersamfunnet kan bygge videre på disse modellene for å utforske nye RL-teknikker for resonnement, og potensielt akselerere hele feltet.