Az NVIDIA a 2025-ös CES kiállításon számos előrelépést jelentett be a mesterséges intelligencia terén, és olyan új fejlesztéseket mutatott be, amelyek egyesítik a vállalat korábbi sikereit a szintetikus adatgenerálásban az autonóm döntéshozatalra összpontosítva.
Az új kiadások közé tartozik a Cosmos World Foundation Model (WFM) platform – egy kiterjedt eszköztár a létrehozásához fotorealisztikus, fizikán alapuló videók és forgatókönyvek – és a Nemotron láma és Cosmos Nemotron családok, amelyek lehetővé teszik a nyelvet, a látásmódot és a döntéshozó mesterséges intelligenciát különböző ágazatokban, például a robotikában, az egészségügyben és az autonóm járművekben.
Kapcsolódó: Nvidia Reveals RTX 50-es sorozatú Blackwell GPU-k DLSS 4-gyel és kétszer akkora teljesítményű, mint az RTX 4090
“A Cosmost azért hoztuk létre, hogy demokratizáljuk a fizikai mesterséges intelligenciát, és minden fejlesztő számára elérhetővé tegyük az általános robotikát”-mondta Jensen Huang, az NVIDIA alapítója és vezérigazgatója. „Az AI-ügynökök a következő robotipar, és valószínűleg több milliárd dolláros lehetőséget jelent majd.”
A szintetikus adatgenerálás, a képfeldolgozás és a fejlett nyelvi modellek egy ernyő alatt történő kombinálásával az NVIDIA arra törekszik, hogy egyszerűsítse az átmenetet adatok létrehozása a teljesen működőképes mesterséges intelligencia rendszerekhez Ez a megközelítés a Nemotron-4 340B sorozat sikerét követi, amely korábban a nagy nyelvi modellek kiváló minőségű képzési adatainak hiányát kezelte. (LLM-ek).
[beágyazott tartalom]
Nemotron-4 340B: Adatvezérelt Alapítvány létrehozása
2024 közepén az NVIDIA bemutatta a Nemotron-4 340B modell az összetett mesterségesintelligencia-alkalmazások korlátozott adatelérhetőségének kezelésére olyan iparágak, mint az egészségügy, a pénzügy és a gyártás.
A Nemotron-4 340B három változatot kínált – Base, Instruct és Reward Az Instruct modellek segítettek a fejlesztőknek az AI-kimenetek egyértelmű utasításokon keresztül történő irányításában, míg a Reward modellek pontozták a generált eredményeket. olyan paramétereken alapuló válaszok, mint a pontosság és a koherencia. Ez az ismétlődő visszacsatolási mechanizmus értékesnek bizonyult a nagy nyelvi modellek betanításában, a fejlesztés felgyorsításában és a modellek megbízhatóságának javításában.
A Nemotron-4 340B kezdeményezés zökkenőmentesen integrálódott az NVIDIA NeMo platformjába és a TensorRT-LLM könyvtárba is, így a felhasználók számára optimalizálást biztosít. és rugalmasság az AI munkafolyamataikban. A Nemotron-4 340B által generált szintetikus adatok alapozták meg az NVIDIA legújabb áttöréseit az ügynöki és fizikai mesterségesintelligencia terén, amelyek áthidalják az adatkezelést, a modellképzést és a telepítési igényeket.
Llama Nemotron és Cosmos Nemotron: Expanding Agentic AI
Az NVIDIA legújabb ajánlatai a Nemotronban A család – Llama Nemotron és Cosmos Nemotron – az adatgeneráláson túlmenően a valós idejű mesterséges intelligencia-ügynökök támogatására szolgál. A Llama Nemotron nagynyelvi modellek (LLM-ek) olyan feladatokat látnak el, mint a kódolás, a függvényhívások, a chat és a matematikai számítások, míg a Cosmos Nemotron látásnyelvi modellek (VLM-ek) a videók, képek és érzékelő feedek.
„Az ügynöki mesterséges intelligencia a mesterséges intelligencia fejlesztésének következő határa, és ennek a lehetőségnek a megvalósításához teljes stack optimalizálás szükséges az LLM-rendszeren keresztül, hogy hatékony, pontos mesterségesintelligencia-ügynököket biztosíthasson” – mondta Ahmad Al-Dahle, a GenAI alelnöke és vezetője. a Meta közleményében: „Az Nvidiával való együttműködésünknek és a nyitott modellek iránti közös elkötelezettségünknek köszönhetően a Llamára épülő Nvidia Llama Nemotron család segíthet a vállalkozásoknak gyorsan saját maguk létrehozásában. egyéni AI-ügynökök.”
Nvidia Agentic AI architektúra (Kép: Nvidia)
Ez A kétirányú megközelítés speciális NVIDIA NIM mikroszolgáltatásokat foglal magában, amelyek olyan erőforrás-igényes feladatokat kezelnek, mint a videókeresés, az összegzés és az érzékelő értelmezés. A nyelvi és vizuális feldolgozás integrálásával az AI-ügynökök számos alkalmazást kezelhetnek, a raktári logisztikától az orvosi képalkotó elemzésig.
Cosmos World Foundation modellek
Emellett a Llama Nemotron és a Cosmos Nemotron családok, az NVIDIA elindította a Cosmos World Foundation Model (WFM) platform a>. Ez az új platform fotorealisztikus, fizikai alapú videók és környezetek generálására specializálódott robotikához, autonóm járművekhez és általános „fizikai AI” forgatókönyvekhez. A valósághű szimulációkra való összpontosítása csökkenti a valós világból származó hatalmas mennyiségű adat gyűjtésének és tesztelésének költségeit.
Közeleg a ChatGPT pillanata a robotika számára A nagy nyelvi modellekhez hasonlóan a világalapmodellek is alapvetőek a robot-és AV-fejlesztéshez, de nem mindegyik a fejlesztőknek megvan a szakértelmük és az erőforrásaik a saját képzésükhöz”– jegyezte meg Huang a CES nyitóbeszédében.
A fejlesztők a Cosmos WFM-ek segítségével személyre szabott forgatókönyveket hozhatnak létre, amelyek bonyolultabbá teszik az AV-rendszerekhez szükséges havas utakat vagy a zsúfolt raktárakat. padlók a robotika teszteléséhez. Ezek a fizika-tudatos adatkészletek vagy finomíthatják a meglévő modelleket, vagy önálló képzési erőforrásként szolgálhatnak. A vállalat ezeket a modelleket nyílt modelllicenc alatt tette elérhetővé, hogy kiterjessze a hozzáférést a fejlett mesterségesintelligencia-fejlesztéshez.
A fizikai AI felgyorsítása adatok és számítási hatékonyság révén
A fizikai mesterséges intelligencia továbbra is számításigényes, és nagy pontosságú adatokra van szükség a valós világ szimulálásához. A Cosmos felgyorsított videofeldolgozási folyamatot és fejlett videotokenizátorokat kínál (az NVIDIA nyílt modelllicencével, az Hugging Facen keresztül) úgy kezeli ezeket a kihívásokat. a> és GitHub), valamint az NVIDIA NeMo kurátor az adatok címkézéséhez és kezeléséhez.
Ennek a folyamatnak az a célja, hogy hatalmas mennyiségű videoadatot dolgozzon fel – akár 20 millió órát is 14 nap alatt az NVIDIA Blackwell platform használatával –, nem pedig több éves CPU-hoz kötött műveleteket.
Ezek a hatékonyságnövekedés segíti azokat a szervezeteket, amelyek mesterséges intelligencia-modelljeik fejlesztésére, tesztelésére és finomítására törekszenek anélkül, hogy a valós adatkorlátok korlátoznák őket. A Cosmos Tokenizer tömöríti a képeket és a videókat, csökkenti a többletköltséget, miközben megőrzi az alapvető minőséget a fejlett AI-rendszerek betanításához. Az NVIDIA szerint ezek az optimalizálások megnyitják az utat a gyorsabb iterációhoz a robotika és az autonóm járművek kutatásában.
Ipari átvétel
A robotika és az autóipari technológia főbb szereplői erős érdeklődést mutatott a Kozmosz iránt. Az olyan cégek, mint az 1X, az Agile Robots, az Agility, a Figure AI, a Foretellix, az Uber, a Waabi és az XPENG azok közé tartoznak, amelyek integrálják az új platformot fejlesztési folyamataiba.
Az XPENG például humanoid robotikáját tervezi továbbfejleszteni. kezdeményezéseket, miközben a telekocsi-óriás Uber együttműködik az NVIDIA-val, hogy a Cosmost a jobb adatkezelés és forgatókönyv generálás érdekében hasznosítsa. „A generatív mesterséges intelligencia a mobilitás jövőjének hajtóereje lesz, amely gazdag adatmennyiséget és nagyon hatékony számítástechnikát is igényel” – mondta Dara Khosrowshahi, az Uber vezérigazgatója. „Az NVIDIA-val együttműködve biztosak vagyunk abban, hogy segíthetünk a biztonságos és méretezhető autonóm vezetés idővonalának növelésében. megoldások az iparág számára.”
Az olyan vállalatok, mint az SAP és a ServiceNow, hasonlóképpen felkarolták az NVIDIA Nemotron családjait. „Azok a mesterséges intelligencia-ügynökök, amelyek az üzletág több területén összetett feladatok megoldásában együttműködnek, a vállalati termelékenység egy teljesen új szintjét nyitják meg a mai generatív mesterségesintelligencia-forgatókönyveken túl” – mondta Philipp Herzig, az SAP mesterséges intelligencia igazgatója közleményében. „Az SAP Joule-jának köszönhetően vállalati felhasználók százmilliói fognak interakcióba lépni ezekkel az ügynökökkel, hogy minden eddiginél gyorsabban elérjék céljaikat.”
NeMo Integráció, nyílt licencelés és biztonsági intézkedések
Minden Cosmos WFM és Nemotron modell interfész az NVIDIA NeMo keretrendszer, amely lehetővé teszi a finomhangolást, az igazítást és a visszakereséssel kiegészített generálást (RAG). A NeMo kurátoron keresztül a fejlesztők nagyszabású videóadatokat dolgozhatnak fel, míg az emberi visszajelzésekből származó megerősítő tanulás (RLHF) finomítja a modelleket a megfelelő, kontextus-vezérelt válaszok fenntartása érdekében.
Az NVIDIA nyílt modelllicenc keretében adta ki a Cosmost, ezzel ösztönzi az együttműködést és a testreszabást a robotikai és AV-közösségen belül. A vállalat megjegyezte a biztonságos és felelősségteljes mesterséges intelligencia érdekében tett intézkedéseket is, beleértve a mesterséges intelligencia által generált tartalmak vízjelezését, a káros szövegek és képek csökkentését célzó védőkorlátok bevezetését, valamint a globális mesterségesintelligencia-biztonsági kezdeményezésekhez való igazodást.
Bízunk benne, hogy tudunk segíteni. fel kell tölteni a biztonságos és skálázható autonóm vezetési megoldások ütemtervét az iparág számára” – tette hozzá Khosrowshahi, hangsúlyozva, hogy egyre nagyobb hangsúlyt fektetnek a megbízható, átlátható AI-rendszerekre.
Egységes mesterséges intelligencia-ökoszisztéma felé
A Nemotron-4 340B szintetikus adatvezérelt megközelítésének és az új Cosmos WFM platform összevonásával az NVIDIA egységes utat mutat be az AI számára amely a kutatást, a vállalati telepítést és a fizikai automatizálást öleli fel a Llama Nemotron és a Cosmos Nemotron családok kulcsszerepet töltenek be az ügynöki AI-ban A Cosmos WFM-ek a robotika és az autonóm járműfejlesztés bonyolult kérdéseivel foglalkoznak.
A költséghatékony adatgenerálástól a valós idejű nyelvi és látási feladatokhoz speciális mikroszolgáltatásokig az NVIDIA legújabb portfóliója a mesterséges intelligencia fejlesztésének sokoldalú stratégiáját példázza. Ahogy egyre több vállalat, fejlesztő és kutató alkalmazza ezeket a modelleket, úgy tűnik, hogy az autonóm rendszerek és az intelligens szoftverügynökök pályája felgyorsul.