Nvidia on julkaissut OpenReasoning-nemotronin, uuden voimakkaan ja tehokkaan avoimen lähdekoodin AI-mallin perheen. Ilmoitettu 19. heinäkuuta 2025 ja Globaalisti käytettävissä halaamalla kasvot , mallit, jotka ovat uuden performanssitiedot matematiikassa, ja koodissa. Mallit tislaamalla ominaisuudet Deepseekin massiivisesta 671b R1-0528-mallista, joka on yksi Kiinan parhaista AI-järjestelmistä. Tämä strategia tarjoaa kehittäjille ilmaisen, kaupallisesti sallitun pääsyn huipputekniseen päättelyyn. Tämä välttää tarvetta raja-asteikkojen laskentaresurssien avaamista pienemmille ryhmille ja tutkijoille.

tislausvoima Frontier-mallista

OpenReasoning-nemotronin ytimessä on hienostunut tislausstrategia. NVIDIA hyödynsi äskettäin päivitettyä Deepseek-R1-0528-mallia, 671 miljardin parametrin voimalaitosta, opettaa pienempiä malleja edistyneiden päättelytaitojensa.

Tämä saavutettiin kouluttamalla Deepseek-mallin tuottamaa 5 miljoonaa korkealaatuista päättelyä koskevaa tietojoukkoa. Prosessi siirtää yleisen päättelykyvyn kompakteihin arkkitehtuureihin, jotka perustuvat Alibaban Qwen 2.5-kehykseen.

Tulokset ovat vaikuttavia. Nvidian vertailuarvojen mukaan Nemotron-mallit perustavat uusia huipputeknisiä pass@1-pisteitä kokoluokilleen. Esimerkiksi 32B-malli pisteet 89,2 AIME24: llä ja 70,2: lla LiveCodebenchillä ilman erityistä virittämistä.

vielä vaativammille tehtäville Nvidia esitteli “raskaan”tilan käyttämällä generatiivista valintaa (genselect). Tämä menetelmä tuottaa useita potentiaalisia ratkaisuja ja valitsee mallin parhaan, merkittävästi lisäämään tarkkailua kompleksien ongelmien kanssa

genselektiivillä malleilla. HMMT-helmikuussa 2025 Matematiikan vertailuarvo hyppää 73,8: sta uskomattomaan 96.7: een, mikä osoittaa voimakkaita nousevia päättelyominaisuuksia mittakaavassa.

Deepseek-yhteys ja geopoliittinen konteksti

Deepseekin mallin valinta lähteenä on pääasiallinen pääasiallinen tekniikka. Deepseek teki aaltoja toukokuussa 2025 R1-0528-päivityksellä, väittäen, että sen suorituskyky oli “lähestymässä johtavia malleja, kuten O3 ja Gemini 2.5 Pro”, kilpailijoilta, kuten Openai ja Google. Huhtikuussa 2025 yhdysvaltalainen talokomitea merkitsi Deepseekin kansallisen turvallisuusriskin. Komitean puheenjohtaja John Moolenaar antoi jyrkän varoituksen yrityksestä. NVIDIA: n mallin käyttö korostaa globaalin AI-kehityksen toisiinsa liittynyttä luonnetta. Ne on suunniteltu helppoa integroitumista työkaluihin, kuten NVIDIA NEMO-kehykseen, Tensorrt-LLM: iin ja kasvojen muuntajien halaamiseen, nopean käyttöönoton helpottamiseen.

käyttämällä vain valvottua hienosäätöä (SFT) ja välttämällä vahvistusoppimista (RL), NVIDIA tarjoaa vahvan, vakaan perustan. Tämän avulla tutkimusyhteisö voi rakentaa näitä malleja tutkia uusia RL-tekniikoita päättelyä varten, mahdollisesti kiihdyttämällä koko kenttää.

Categories: IT Info