NVIDIA 在CES 2025 上宣布了人工智慧的多項進展,公佈了新的開發成果,這些新開發成果將公司先前在合成資料生成方面的成功與對自主決策的關注融為一體。/p>

新版本包括Cosmos World Foundation Model (WFM) 平台——一個用於創建照片級真實、基於物理的視頻和場景的廣泛工具包——以及Llama Nemotron 加上 Cosmos Nemotron 系列,可在機器人、醫療保健等不同領域實現語言、視覺和決策人工智慧和自動駕駛汽車。

相關:Nvidia 推出採用DLSS 4 的RTX 50 系列Blackwell GPU,性能是RTX 4090 的兩倍

「我們創建物理人工Cosmos智慧的民主化,讓通用機器人技術觸手可及,」NVIDIA 創始人黃仁勳說。和執行長。 「人工智慧代理是下一個機器人產業,可能會帶來數十億美元的機會。」

透過將合成資料生成、視覺處理和高級語言模型整合到一起,NVIDIA 渴望簡化從這種方法繼承了Nemotron-4 340B 系列的成功,該系列先前解決了大型語言模型(LLM) 高品質訓練資料的短缺問題。建立數據驅動的基礎

2024 年中期,NVIDIA 推出了Nemotron-4 340B 模型,以解決複雜AI 應用程式的有限數據可用性問題。 、金融和製造等行業提供高水準的細化和適應。人工智慧輸出,而獎勵模型則根據準確性和連貫性等參數對產生的回應進行評分。事實證明,這種迭代回饋機制對於訓練大型語言模型、加快開發速度和提高模型可靠性非常有價值。縫集成,為使用者提供優化以及人工智慧工作流程的靈活性。 Nemotron-4 340B 產生的合成資料為 NVIDIA 在代理和實體 AI、橋接資料管理、模型訓練和部署需求方面的最新突破奠定了基礎。代理AI

NVIDIA Nemotron 系列的最新產品(Llama Nemotron 和Cosmos Nemotron)不僅限於資料生成,也為即時AI 代理提供支援。 Llama Nemotron 大語言模型 (LLM) 滿足編碼、函數呼叫、聊天和數學計算等任務,而 Cosmos Nemotron 視覺語言模型 (VLM) 則專注於解釋和回應 視訊、影像和感測器來源

「代理人工智慧是人工智慧開發的下一個前沿,並提供Meta 副總裁兼GenAI負責人Ahmad Al-Dahle 在聲明中表示:「抓住這個機會,需要跨法學碩士系統進行全端優化,以提供高效、準確的AI 代理。」秉承對開放模型的承諾,基於Llama 構建的Nvidia Llama Nemotron 系列可以幫助企業快速創建自己的客製化AI 代理。 」

Nvidia Agentic AI 架構(圖:Nvidia)

這種雙管齊下的方法結合了專門的NVIDIA NIM 微服務,用於處理影片搜尋、摘要和感測器解釋等資源密集型任務。透過整合語言和視覺處理,人工智慧代理可以管理從倉庫物流到醫學影像分析的一系列應用程式。 Llama Nemotron 和Cosmos Nemotron 系列,NVIDIA 推出了Cosmos World 基礎模式(WFM) 平台。這個新平台專門為機器人、自動駕駛汽車和一般「物理人工智慧」場景生成逼真的、基於物理的視訊和環境。 p>

「機器人的ChatGPT 時刻即將到來,就像大型語言模型一樣,世界基礎模型是推進機器人和AV 開發的基礎,但並非所有開發人員都擁有培訓自己的專業知識和資源,」黃在書中指出。這些物理感知資料集可以改進現有模型或用作獨立的培訓資源。該公司已在開放模型許可下提供這些模型,旨在擴大高級人工智慧開發的範圍。 p >物理人工智慧對運算的要求仍然很高,需要高保真數據來模擬現實世界。 Cosmos 透過提供加速視訊處理管道、進階視訊標記器(可在 NVIDIA 的開放模式許可下透過Hugging FaceGitHub),以及NVIDIA NeMo Curator 用於資料標記和管理。

該管道旨在處理大量視訊資料(使用 NVIDIA Blackwell 平台在 14 天內處理多達 2000 萬小時),而不是進行數年受 CPU 限制的操作。

這些效率提升有助於組織尋求開發、測試和完善其人工智慧模型,而不受現實世界資料約束的限制。 Cosmos Tokenizer 壓縮圖像和視頻,減少開銷,同時保留訓練高級 AI 系統的基本品質。據NVIDIA 稱,這些優化為機器人和自動駕駛汽車研究的更快迭代鋪平了道路。主要參與者已經對 Cosmos 表現出了濃厚的興趣。 1X、Agile Robots、Agility、Figure AI、Foretellix、Uber、Waabi 和小鵬汽車等公司都將新平台整合到其開發流程中。倡議,而乘車巨頭Uber 則與NVIDIA 合作,利用Cosmos 來更好地管理資料和生成場景。 Uber 執行長Dara Khosrowshahi 表示:「生成式AI 將為行動移動的未來提供動力,需要豐富的數據和非常強大的運算能力。透過與NVIDIA 合作,我們有信心能夠幫助加速安全、可擴展的自動駕駛的進程。 SAP 首席人工智慧長 Philipp Herzig 在聲明中表示:「跨多個業務線協作解決複雜任務的人工智慧代理將把企業生產力提升到一個全新的水平,超越當今的生成式人工智慧場景。」數億企業用戶將與這些代理商互動,以比以往更快的速度實現他們的目標。 >所有Cosmos WFM 和Nemotron 型號均與NVIDIA 的NeMo 框架 接口,從而實現精細-調整、對齊和檢索增強生成(RAG)。透過NeMo Curator,開發人員可以處理大規模視訊數據,同時根據人類回饋(RLHF) 進行強化學習來完善模型,以保持適當的、情境驅動的反應。://developer.nvidia.com/cosmos”>NVIDIA 在開放模式許可下發布了 Cosmos,鼓勵機器人和 AV 社群內的協作和客製化。該公司還指出了安全和負責任的人工智慧的措施,包括對人工智慧生成的內容加浮水印、實施護欄以減少有害文字或圖像,以及與全球人工智慧安全倡議保持一致。 >「我們有信心能夠提供幫助加快了行業安全、可擴展的自動駕駛解決方案的時間表。」Khosrowshahi 補充道,他強調了人們對可信、透明的人工智慧系統的日益重視。

邁向統一的人工智慧生態系統

透過將Nemotron-4 340B 的合成資料驅動方法與新的Cosmos WFM 平台相結合,NVIDIA 為涵蓋研究、企業部署和物理自動化的AI 制定了統一的路徑。數據生成到為即時語言和視覺任務提供專門的微服務,NVIDIA 的最新產品組合體現了人工智慧進步的多功能策略。隨著越來越多的企業、開發人員和研究人員採用這些模型,自主系統和智慧軟體代理的發展軌跡似乎即將加速。

Categories: IT Info