Nvidia wydała OpenReasoning-Nemotron, nową rodzinę potężnych i wydajnych modeli AI z open source. Ogłoszono 19 lipca 2025 r. I Dostępne globalnie za pośrednictwem twarzy uścisku , modele ustawiają nowe rekordy wydajności dla rozumowania w matematyce i kod. Dzięki możliwościom destylacji z masywnego modelu 671b R1-0528 Deepseek, jednego z najlepszych systemów AI w Chinach. Ta strategia zapewnia programistom bezpłatny, dopuszczalny komercyjnie dostęp do najnowocześniejszego rozumowania AI.
Wydanie ma na celu demokratyzację zaawansowanych możliwości, udostępniając je w rozmiarach parametrów 1,5b, 7b, 14b i 32B. Unika potrzeby zasobów obliczeniowych w skali granicznej, otwierania drzwi dla mniejszych zespołów i badaczy.
moc destylacyjna z modelu granicznego
u podstaw openreasoning-nemotron jest wyrafinowana strategia destylacji. NVIDIA wykorzystała niedawno zaktualizowany model DeepSeek-R1-0528, 671 miliardowy parametrów potęgi, aby uczyć mniejszych modeli jego zaawansowanych umiejętności rozumowania.
Osiągnięto to poprzez szkolenie na wyselekcjonowanym zestawie danych 5 milionów przykładów rozumowania wysokiej jakości wygenerowanych przez model Deepseek. Proces przenosi uogólnioną zdolność rozumowania na bardziej kompaktowe architektury oparte na ramie QWEN 2.5 Alibaba.
Wyniki są imponujące. Według testów porównawczych Nvidia modele Nemotron ustanawiają nowe najnowocześniejsze wyniki PASS@1 dla ich klas wielkości. Model 32B, na przykład, wynosi 89,2 na AIME24 i 70.2 na LiveCodeBench bez specjalnego strojenia.
W przypadku jeszcze bardziej wymagających zadań NVIDIA wprowadziła tryb „ciężki” przy użyciu techniki zwanej selekcją generatywną (Genselect). Ta metoda generuje wiele potencjalnych rozwiązań i wykorzystuje model do wybrania najlepszego, Znacząco zwiększanie dokładności kompleksowych problemów .
z modelem gensElECT, 32B OCES. W HMMT FEB 2025 Math Benchmark przeskakuje z 73,8 do niesamowitego 96,7, wykazując potężne możliwości rozumowania na skalę.
Połączenie Deepeek i kontekst geopolityczny
Wybór modelki Deepseek jest główną sprawą sprawdzania poprawności chińskiej firmy. Deepseek fale dokonały fal w maju 2025 r. Z aktualizacją R1-0528, twierdząc, że jego wydajność „zbliża się do wiodących modeli, takich jak O3 i Gemini 2.5 Pro”, od konkurentów takich jak Openai i Google.
Postęp ten występuje pośród intensywnych geopolitycznych wiatrów. W kwietniu 2025 r. Komitet Izby Stanów Zjednoczonych nazwał Deepseek za ryzyko bezpieczeństwa narodowego. Przewodniczący komitetu John Moolenaar wydał wyraźne ostrzeżenie o firmie.
stwierdził: „Ten raport wyjaśnia: Deepseek to nie tylko kolejna aplikacja AI-jest bronią w arsenale chińskiej partii komunistycznej, zaprojektowanej do szpiegowania Amerykanów, kradzieży naszej technologii i obciążenia prawa USA”. Zastosowanie modelu przez NVIDIA podkreśla powiązany charakter globalnego rozwoju AI.
Nvidia wydało wszystkie cztery modele OpenReasoning-Nemotron pod A w handlu licencja na komercyjnie . Są one zaprojektowane z myślą o łatwej integracji z narzędziami, takimi jak NVIDIA NEMO Framework, Tensorrt-Llm i przytulanie transformatorów twarzy, ułatwiając szybkie wdrażanie.
Przy użyciu tylko nadzorowanego dostrojenia (SFT) i unikającym uczenia się wzmocnienia (RL), NVIDIA stanowi silną, stabilną linię wyjściową. Pozwala to społeczności badawczej na budowę tych modeli w celu zbadania nowych technik RL rozumowania, potencjalnie przyspieszając całą dziedzinę.