Nvidia a lansat OpenReasoning-Nemotron, o nouă familie de modele AI cu sursă deschisă și eficientă. Anunțat pe 19 iulie 2025 și Disponibil la nivel global prin Hugging Face , modelele au stabilit noi înregistrări de performanță pentru motive în matematică, știință și cod. Modele prin distilarea capacităților de la modelul masiv de 671B R1-0528 al Deepseek, unul dintre cele mai bune sisteme AI din China. Această strategie oferă dezvoltatorilor un acces gratuit, permisiv din punct de vedere comercial, la AI-ul de ultimă generație,

Eliberarea își propune să democratizeze capabilități avansate, ceea ce le pune la dispoziție în dimensiuni de 1,5B, 7B, 14B și 32B. Acest lucru evită necesitatea resurselor de calcul la scară de frontieră, deschiderea ușilor pentru echipe și cercetători mai mici.

puterea de distilare de la un model de frontieră

la baza deschiderii-nemotron este o strategie de distilare sofisticată. Nvidia a susținut modelul DeepSeek-R1-0528 recent modernizat, o putere de 671 de miliarde de parametri, pentru a învăța modelele mai mici abilitățile sale de raționament avansate.

Acest lucru a fost obținut prin antrenament pe un set de date curat de 5 milioane de exemple de raționament de înaltă calitate generate de modelul Deepseek. Procesul transferă capacitatea de raționament generalizată în arhitecturi mai compacte bazate pe cadrul QWEN 2.5 al Alibaba.

Rezultatele sunt impresionante. Conform reperelor NVIDIA, modelele Nemotron stabilesc noi scoruri de ultimă generație@1 pentru clasele lor de mărime. Modelul 32B, de exemplu, marchează 89.2 pe AIME24 și 70.2 pe LiveCodebench fără o reglare specială.

Pentru sarcini și mai solicitante, Nvidia a introdus un mod „greu” folosind o tehnică numită selecție generativă (Genlect). Această metodă generează multiple soluții potențiale și folosește modelul pentru a-l selecta pe cel mai bun, stimularea semnificativă a preciziei pe probleme complexe . Scor la HMMT Feb 2025 Math Benchmark salt de la 73.8 la un incredibil 96.7, care demonstrează capacități de raționament emergente puternice la scară.

Conexiunea profundă și contextul geopolitic

alegerea modelului de profunzime, ca sursă, este o tehnologie valabilă majoră a firmei chineze. Deepseek a făcut valuri în mai 2025 cu actualizarea sa R1-0528, susținând că performanța sa „se apropie de cea a modelelor de frunte, cum ar fi O3 și Gemini 2.5 Pro”, de la concurenți precum OpenAI și Google.

Acest progres are loc pe fondul unor spații de cap geopolitice intense. În aprilie 2025, un comitet al Casei SUA a etichetat Deepseek un risc de securitate națională. Președintele comisiei, John Moolenaar, a emis un avertisment accentuat despre companie.

El a declarat: „Acest raport arată clar: Deepseek nu este doar o altă aplicație AI-este o armă în arsenalul Partidului Comunist Chinez, conceput pentru a spiona americani, a fura tehnologia noastră și a subverti legea SUA.” Utilizarea modelului NVIDIA evidențiază natura interconectată a dezvoltării AI globale.

nvidia a lansat toate cele patru modele OpenReasoning-nemotron sub A Licență de autorizare comercială . Acestea sunt concepute pentru o integrare ușoară cu instrumente precum cadrul NVIDIA NEMO, Tensorrt-Llm și îmbrățișarea transformatoarelor de față, facilitând implementarea rapidă.

prin utilizarea doar a reglării fine (SFT) și evitarea învățării de întărire (RL), NVIDIA oferă o bază de bază puternică și stabilă. Acest lucru permite comunității de cercetare să se bazeze pe aceste modele pentru a explora noi tehnici RL pentru raționament, care ar putea accelera întregul câmp.

Categories: IT Info