NVIDIA ka njoftuar disa avancime në AI në CES 2025, duke zbuluar zhvillime të reja që bashkojnë sukseset e mëparshme të kompanisë në gjenerimin e të dhënave sintetike me fokusin e saj në vendimmarrjen autonome.

Publikimet e reja përfshijnë Platforma e Modelit të Fondacionit Botëror Cosmos (WFM)—një e gjerë paketën e veglave për krijimin e videove dhe skenarëve fotorealë, të bazuara në fizikë—dhe Llama Nemotron plus Familjet Cosmos Nemotron, të cilat mundësojnë gjuhën, vizionin dhe AI ​​vendimmarrëse në sektorë të ndryshëm si robotika, kujdesi shëndetësor, dhe automjete autonome.

I ngjashëm: Nvidia zbulon GPU-të Blackwell të Serisë RTX 50 me GPU me DLSS 4 dhe dyfishi i fuqisë së RTX 4090

Ne krijuam demokratizoni inteligjencën artificiale fizike dhe vendosni robotikën e përgjithshme në dispozicion të secilit zhvillues”, tha Jensen Huang, themeluesi dhe CEO i NVIDIA.”Agjentët e AI është industria e ardhshme robotike dhe ka të ngjarë të jetë një mundësi shumë miliarda dollarësh.”

Duke kombinuar gjenerimin e të dhënave sintetike, përpunimin e vizionit dhe modelet e avancuara të gjuhës nën një ombrellë, NVIDIA aspiron të thjeshtojë kalimin nga krijimi i të dhënave për sistemet plotësisht funksionale të AI Kjo qasje ndjek suksesin e serisë Nemotron-4 340B, e cila më parë adresonte mungesat e. të dhëna trajnimi me cilësi të lartë për modelet e mëdha gjuhësore (LLM).

[përmbajtje e integruar]

Nemotron-4 340B: Krijimi i një fondacioni të drejtuar nga të dhënat

Në mesi i vitit 2024, NVIDIA prezantoi modelet Nemotron-4 340B për të trajtuar disponueshmërinë e kufizuar të të dhënave për aplikacionet komplekse të AI të dhëna sintetike në shkallë, duke mundësuar përsosje dhe përshtatje të nivelit të lartë për industri si kujdesi shëndetësor, financa dhe prodhimi.

Nemotron-4 340B ofroi tre variante—Modelet Base, Instruct dhe The Instruct ndihmuan zhvilluesit të drejtonin AI rezulton përmes direktivave të qarta, ndërsa modelet e shpërblimit vlerësuan përgjigjet e gjeneruara bazuar në parametra të tillë si saktësia dhe koherencë. Ky mekanizëm përsëritës i reagimit u tregua i vlefshëm për trajnimin e modeleve të mëdha gjuhësore, përshpejtimin e zhvillimit dhe përmirësimin e besueshmërisë së modelit.

Iniciativa Nemotron-4 340B gjithashtu u integrua pa probleme me platformën NeMo të NVIDIA dhe bibliotekën TensorRT-LLM, duke u ofruar përdoruesve optimizim dhe fleksibilitet në rrjedhat e tyre të punës së AI. Të dhënat sintetike të gjeneruara nga Nemotron-4 340B hodhën themelet për përparimet më të fundit të NVIDIA në AI agjenturore dhe fizike, duke kapërcyer kurimin e të dhënave, trajnimin e modelit dhe nevojat e vendosjes.

Llama Nemotron dhe Cosmos Nemotron: Expanding. Agentic AI

Ofertat më të reja të NVIDIA në Familja Nemotron-Llama Nemotron dhe Cosmos Nemotron-lëvizin përtej vetëm gjenerimit të të dhënave për të fuqizuar agjentët e AI në kohë reale. Modelet e gjuhëve të mëdha të Llama Nemotron (LLM) kujdesen për detyra të tilla si kodimi, thirrja e funksioneve, biseda dhe llogaritjet matematikore, ndërsa modelet e gjuhës së vizionit Cosmos Nemotron (VLM) fokusohen në interpretimin dhe përgjigjen ndaj të dhënave vizuale në video, imazhe dhe sensorë feeds.

“Inteligjenca artificiale e artificiale është kufiri tjetër i zhvillimit të AI dhe ofrimi i kësaj mundësie kërkon optimizim të plotë në një sistem LLM për të ofruar agjentë efikasë dhe të saktë të AI,”tha Ahmad. Al-Dahle, nënkryetar dhe kreu i GenAI në Meta, në një deklaratë “Përmes bashkëpunimit tonë me Nvidia dhe angazhimit tonë të përbashkët për modelet e hapura, Nvidia Llama. Familja Nemotron e ndërtuar në Llama mund t’i ndihmojë ndërmarrjet të krijojnë shpejt agjentët e tyre të personalizuar të AI.”

Nvidia Arkitektura agjente e AI (Imazhi: Nvidia)

Kjo qasje e dyfishtë përfshin mikroshërbime të specializuara NVIDIA NIM që trajtojnë Detyra me burime të rënda si kërkimi i videos, përmbledhja dhe interpretimi i sensorëve. Duke integruar gjuhën dhe përpunimin vizual, agjentët e AI mund të menaxhojnë një sërë aplikacionesh, nga logjistika e magazinës deri tek analiza e imazheve mjekësore.

Modelet e Fondacionit Cosmos World

Përveç kësaj. familjet Llama Nemotron dhe Cosmos Nemotron, NVIDIA lançoi Platforma Cosmos World Foundation Model (WFM). Kjo platformë e re është e specializuar në gjenerimin e videove fotoreale, të bazuara në fizikë dhe mjediseve për robotikë, automjete autonome dhe skenarë të përgjithshëm të”AI fizike”. Përqendrimi i saj në simulimet realiste ul kostot që lidhen me mbledhjen dhe testimin e sasive masive të të dhënave në botën reale.

“Momenti ChatGPT për robotikën po vjen, ashtu si modelet e mëdha të gjuhëve, modelet e themelimit botëror janë thelbësore për avancimin zhvillimi i robotëve dhe AV, megjithatë jo të gjithë zhvilluesit kanë ekspertizën dhe burimet për të trajnuar të tyren,”vuri në dukje Huang në fjalimin e tij të hapjes në CES.

Zhvilluesit mund të përdorin Cosmos WFM për të krijuar skenarë të përshtatur, duke shtuar kompleksitete të tilla si p.sh. rrugë me borë për sistemet AV ose dysheme të ngjeshur të magazinës për testimin e robotikës. Këto grupe të dhënash të vetëdijshme për fizikën mund të përmirësojnë modelet ekzistuese ose të shërbejnë si një burim i pavarur trajnimi. Kompania i ka vënë këto modele të disponueshme nën një licencë modeli të hapur, duke synuar të zgjerojë aksesin në zhvillimin e avancuar të AI.

Përshpejtimi i inteligjencës artificiale fizike përmes të dhënave dhe efikasitetit llogaritës

>Inteligjenca artificiale fizike mbetet kërkuese llogaritëse, duke kërkuar të dhëna me besnikëri të lartë për të simuluar botën reale. Cosmos i trajton këto sfida duke ofruar një linjë të përshpejtuar të përpunimit të videove, tokenizues të avancuar video (të disponueshëm nën licencën e modelit të hapur të NVIDIA, nëpërmjet Fytyrë përqafuese dhe GitHub), dhe Kuratori NVIDIA NeMo për etiketimin dhe kurimin e të dhënave.

Ky tubacion synon të përpunojë sasi të mëdha të dhënash video—deri në 20 milionë orë në 14 ditë duke përdorur platformën NVIDIA Blackwell—në vend të viteve të operacioneve të lidhura me CPU.

Këto përfitime të efikasitetit ndihmojnë organizatat që kërkojnë të zhvillojnë, testojnë dhe përsosin modelet e tyre të AI pa u kufizuar nga kufizimet e të dhënave të botës reale. Cosmos Tokenizer ngjesh imazhet dhe videot, duke reduktuar shpenzimet e përgjithshme duke ruajtur cilësinë thelbësore për trajnimin e sistemeve të avancuara të AI. Sipas NVIDIA, këto optimizime hapin rrugën për përsëritje më të shpejtë në robotikë dhe kërkime autonome të automjeteve.

Adoptimi i industrisë

Lojtarët kryesorë në robotikë dhe teknologjinë e automobilave kanë tregoi interes të fortë për Cosmos. Kompani të tilla si 1X, Agile Robots, Agility, Figure AI, Foretellix, Uber, Waabi dhe XPENG janë ndër ato që integrojnë platformën e re në tubacionet e tyre të zhvillimit.

Për shembull, XPENG planifikon të përmirësojë robotikën e tij humanoidale. iniciativat, ndërsa ridesharing gjiganti Uber bashkëpunon me NVIDIA për të shfrytëzuar Cosmos për kurimin më të mirë të të dhënave dhe gjenerimin e skenarëve.”Inteligjenca artificiale gjeneruese do të fuqizojë të ardhmen e lëvizshmërisë, duke kërkuar të dhëna të pasura dhe llogaritje shumë të fuqishme,”tha Dara Khosrowshahi, CEO i Uber.”Duke punuar me NVIDIA, ne jemi të bindur se mund të ndihmojmë në plotësimin e afatit kohor për drejtimin autonom të sigurt dhe të shkallëzuar. zgjidhje për industrinë.”

Kompanitë si SAP dhe ServiceNow kanë përqafuar në mënyrë të ngjashme NVIDIA’s Familjet nemotrone.”Agjentët e AI që bashkëpunojnë për të zgjidhur detyra komplekse në linja të shumta të biznesit do të zhbllokojnë një nivel krejtësisht të ri të produktivitetit të ndërmarrjes përtej skenarëve të sotëm gjenerues të AI,”tha Philipp Herzig, shefi i AI në SAP, në një deklaratë.”Përmes Joule të SAP, qindra miliona përdorues të ndërmarrjeve do të ndërveprojnë me këta agjentë për të përmbushur qëllimet e tyre më shpejt se kurrë më parë.”

Integrimi NeMo, Licencimi i Hapur dhe Masat e Sigurisë

Të gjitha modelet WFM të Cosmos dhe Nemotron ndërlidhen me korniza NeMo, duke mundësuar akordimin, shtrirjen, dhe gjenerimi i shtuar me rikthim (RAG). Nëpërmjet NeMo Kuratorit, zhvilluesit mund të përpunojnë të dhëna video në shkallë të gjerë, ndërsa të mësuarit përforcues nga reagimet njerëzore (RLHF) i përmirëson modelet për të mbajtur përgjigjet e duhura, të drejtuara nga konteksti.

NVIDIA ka lëshuar Cosmos nën një licencë të modelit të hapur, duke inkurajuar bashkëpunimin dhe personalizimin brenda komunitetit të robotikës dhe AV. Kompania gjithashtu vuri në dukje masat për inteligjencën artificiale të sigurt dhe të përgjegjshme, duke përfshirë vulosjen e përmbajtjes së gjeneruar nga AI, zbatimin e parmave mbrojtëse për të zbutur tekstin ose imazhet e dëmshme dhe përafrimin me iniciativat globale të sigurisë së AI.

“Ne kemi besim se mund të ndihmojmë. plotësoni afatin kohor për zgjidhje të sigurta dhe të shkallëzueshme të drejtimit autonome për industrinë,”shtoi Khosrowshahi, duke nënvizuar një theks në rritje në sisteme të besueshme, transparente të AI.

Drejt një ekosistem të unifikuar të AI

Duke bashkuar qasjen sintetike të drejtuar nga të dhënat e Nemotron-4 340B me Cosmos WFM të ri platforma, NVIDIA përcakton një rrugë të unifikuar për AI që përfshin kërkimin, vendosjen e ndërmarrjeve dhe automatizimin fizik Familjet Cosmos Nemotron plotësojnë role kyçe në AI agjenturore, ndërsa Cosmos WFM trajtojnë kompleksitetin e robotikës dhe zhvillimit autonom të automjeteve.

Nga mundësimi i gjenerimit të të dhënave me kosto efektive deri te ofrimi i mikroshërbimeve të specializuara për detyrat e gjuhës dhe vizionit në kohë reale, Portofoli i fundit i NVIDIA ilustron një strategji të gjithanshme për avancimin e AI. Ndërsa më shumë ndërmarrje, zhvillues dhe studiues i miratojnë këto modele, trajektorja për sisteme autonome dhe agjentë softuerësh inteligjentë duket gati për t’u përshpejtuar.

Categories: IT Info