NVIDIA telah mengumumkan beberapa kemajuan dalam AI di CES 2025, mendedahkan perkembangan baharu yang menggabungkan kejayaan terdahulu syarikat dalam penjanaan data sintetik dengan tumpuannya pada pembuatan keputusan autonomi.
Keluaran baharu termasuk platform Model Yayasan Dunia (WFM) Cosmos—kit alat yang luas untuk mencipta video dan senario berasaskan fotoreal, fizik—dan Llama Nemotron serta Cosmos Nemotron keluarga, yang membolehkan AI bahasa, penglihatan dan membuat keputusan dalam pelbagai sektor seperti robotik, penjagaan kesihatan dan kenderaan autonomi.
Berkaitan: Nvidia Reveals RTX 50-GPU siri Blackwell dengan DLSS 4 dan Dua Kali ganda Kuasa RTX 4090
“Kami mencipta Cosmos untuk mendemokrasikan AI fizikal dan meletakkan robotik umum dalam jangkauan setiap pembangun,”kata Jensen Huang, pengasas dan CEO NVIDIA. “Ejen AI ialah industri robotik seterusnya dan berkemungkinan menjadi peluang berbilion dolar.”
Dengan menggabungkan penjanaan data sintetik, pemprosesan penglihatan dan model bahasa lanjutan di bawah satu payung, NVIDIA berhasrat untuk menyelaraskan peralihan daripada penciptaan data kepada sistem AI yang beroperasi sepenuhnya Pendekatan ini mengikuti kejayaan siri Nemotron-4 340B, yang sebelum ini menangani kekurangan data latihan berkualiti tinggi untuk model bahasa yang besar. (LLM).
[kandungan terbenam]
Nemotron-4 340B: Menubuhkan Yayasan Dipacu Data
Pada pertengahan 2024, NVIDIA memperkenalkan Nemotron-4 model 340B untuk menangani ketersediaan data terhad untuk aplikasi AI yang kompleks Model ini menghasilkan data sintetik pada skala, membolehkan penghalusan dan penyesuaian peringkat tinggi untuk industri seperti penjagaan kesihatan, kewangan, dan pembuatan.
Nemotron-4 340B menawarkan tiga varian—model Base, Instruct dan Reward membantu pembangun membimbing output AI melalui arahan yang jelas, manakala model Reward menjaringkan respons yang dijana berdasarkan parameter seperti. ketepatan dan keselarasan. Mekanisme maklum balas berulang ini terbukti berharga untuk melatih model bahasa yang besar, mempercepatkan pembangunan dan meningkatkan kebolehpercayaan model.
Inisiatif Nemotron-4 340B juga disepadukan dengan lancar dengan platform NeMo NVIDIA dan perpustakaan TensorRT-LLM, memberikan pengguna pengoptimuman dan fleksibiliti dalam aliran kerja AI mereka. Data sintetik yang dijana oleh Nemotron-4 340B meletakkan asas untuk penemuan terbaru NVIDIA dalam AI agenik dan fizikal, merapatkan penyusunan data, latihan model dan keperluan penggunaan.
Llama Nemotron dan Cosmos Nemotron: Memperluas AI Agentik
Tawaran terbaharu NVIDIA dalam keluarga Nemotron—Llama Nemotron dan Cosmos Nemotron—bergerak menjangkaui penjanaan data sahaja untuk memperkasakan ejen AI masa nyata. Model bahasa besar (LLM) Llama Nemotron memenuhi tugas seperti pengekodan, panggilan fungsi, sembang dan pengiraan matematik, manakala model bahasa penglihatan Cosmos Nemotron (VLM) menumpukan pada mentafsir dan membalas data visual dalam video, imej dan suapan sensor.
“Agentic AI ialah sempadan pembangunan AI seterusnya, dan melaksanakan peluang ini memerlukan pengoptimuman timbunan penuh merentas sistem LLM untuk menyampaikan ejen AI yang cekap dan tepat,” kata Ahmad Al-Dahle, naib presiden dan ketua GenAI di Meta, dalam satu kenyataan”Melalui kerjasama kami dengan Nvidia dan komitmen bersama kami untuk membuka model, keluarga Nvidia Llama Nemotron yang dibina pada Llama boleh membantu perusahaan mencipta ejen AI tersuai mereka sendiri dengan pantas.”
Seni bina Nvidia Agentic AI (Imej: Nvidia)
Pendekatan dwi-cabang ini menggabungkan perkhidmatan mikro NVIDIA NIM yang mengendalikan tugasan sumber yang berat seperti carian video, ringkasan dan tafsiran penderia. Dengan menyepadukan bahasa dan pemprosesan visual, ejen AI boleh mengurus pelbagai aplikasi, daripada logistik gudang kepada analisis pengimejan perubatan.
Model Yayasan Dunia Cosmos
Selain itu keluarga Llama Nemotron dan Cosmos Nemotron, NVIDIA melancarkan platform Model Yayasan Dunia Cosmos (WFM). Platform baharu ini mengkhususkan diri dalam menghasilkan fotoreal, video berasaskan fizik dan persekitaran untuk robotik, kenderaan autonomi dan senario umum”AI fizikal”. Tumpuannya pada simulasi realistik mengurangkan kos yang berkaitan dengan pengumpulan dan ujian sejumlah besar data dunia sebenar.
“Momen ChatGPT untuk robotik akan datang Seperti model bahasa besar, model asas dunia adalah asas untuk memajukan pembangunan robot dan AV, namun tidak semua pembangun melakukannya kepakaran dan sumber untuk melatih mereka sendiri,”kata Huang dalam ucaptama pembukaannya di CES.
Pembangun boleh menggunakan Cosmos WFM untuk mencipta senario yang disesuaikan, menambah kerumitan seperti jalan bersalji untuk sistem AV atau lantai gudang yang sesak untuk ujian robotik. Set data sedar fizik ini sama ada boleh memperhalusi model sedia ada atau berfungsi sebagai sumber latihan kendiri. Syarikat itu telah menyediakan model ini di bawah lesen model terbuka, bertujuan untuk meluaskan akses kepada pembangunan AI lanjutan.
Mempercepat AI Fizikal Melalui Data dan Kecekapan Pengiraan
AI fizikal kekal menuntut pengiraan, memerlukan data kesetiaan tinggi untuk mensimulasikan dunia sebenar. Cosmos menangani cabaran ini dengan menawarkan saluran paip pemprosesan video yang dipercepatkan, tokenizer video lanjutan (tersedia di bawah lesen model terbuka NVIDIA, melalui Muka Berpeluk a> dan GitHub), dan NVIDIA NeMo Curator untuk pelabelan dan penyusunan data.
Saluran paip ini bertujuan untuk memproses sejumlah besar data video—sehingga 20 juta jam dalam 14 hari menggunakan platform NVIDIA Blackwell—dan bukannya bertahun-tahun operasi terikat CPU.
Pendapatan kecekapan ini membantu organisasi yang ingin membangun, menguji dan memperhalusi model AI mereka tanpa dihadkan oleh kekangan data dunia sebenar. Cosmos Tokenizer memampatkan imej dan video, mengurangkan overhed sambil mengekalkan kualiti penting untuk melatih sistem AI lanjutan. Menurut NVIDIA, pengoptimuman ini membuka jalan untuk lelaran yang lebih pantas dalam robotik dan penyelidikan kenderaan autonomi.
Penggunaan Industri
Pemain utama dalam robotik dan teknologi automotif mempunyai menunjukkan minat yang kuat terhadap Cosmos. Syarikat seperti 1X, Agile Robots, Agility, Figure AI, Foretellix, Uber, Waabi dan XPENG adalah antara yang menyepadukan platform baharu ke dalam saluran paip pembangunan mereka.
Sebagai contoh, XPENG merancang untuk meningkatkan robotik humanoidnya inisiatif, sambil perkongsian tunggangan Uber gergasi bekerjasama dengan NVIDIA untuk memanfaatkan Cosmos untuk penyusunan data dan penjanaan senario yang lebih baik.”AI Generatif akan memperkasakan masa depan mobiliti, memerlukan kedua-dua data yang kaya dan pengiraan yang sangat berkuasa,”kata Dara Khosrowshahi, Ketua Pegawai Eksekutif Uber.”Dengan bekerjasama dengan NVIDIA, kami yakin kami boleh membantu meningkatkan garis masa untuk pemanduan autonomi yang selamat dan berskala. penyelesaian untuk industri.”
Syarikat seperti SAP dan ServiceNow juga telah menerima keluarga Nemotron NVIDIA.”Ejen AI yang bekerjasama untuk menyelesaikan tugas yang kompleks merentasi pelbagai bidang perniagaan akan membuka kunci tahap produktiviti perusahaan yang baharu melangkaui senario AI generatif hari ini,”kata Philipp Herzig, ketua pegawai AI di SAP, dalam satu kenyataan.”Melalui Joule SAP, ratusan juta pengguna perusahaan akan berinteraksi dengan ejen ini untuk mencapai matlamat mereka dengan lebih pantas berbanding sebelum ini.”
Integrasi NeMo, Pelesenan Terbuka dan Langkah Keselamatan
Semua model Cosmos WFM dan Nemotron antara muka dengan Rangka kerja NeMo, membolehkan penalaan halus, penjajaran dan penjanaan dipertingkatkan semula (RAG). Melalui Kurator NeMo, pembangun boleh memproses data video berskala besar, manakala pembelajaran pengukuhan daripada maklum balas manusia (RLHF) memperhalusi model untuk mengekalkan respons yang sesuai dan dipacu konteks.
NVIDIA telah mengeluarkan Cosmos di bawah lesen model terbuka, menggalakkan kerjasama dan penyesuaian dalam komuniti robotik dan AV. Syarikat itu juga mengambil maklum langkah untuk AI yang selamat dan bertanggungjawab, termasuk menanda air kandungan yang dijana AI, melaksanakan pagar untuk mengurangkan teks atau imej yang berbahaya, dan menyelaraskan dengan inisiatif keselamatan AI global.
“Kami yakin kami boleh membantu tambahkan garis masa untuk penyelesaian pemanduan autonomi yang selamat dan berskala untuk industri,”tambah Khosrowshahi, menekankan penekanan yang semakin meningkat pada sistem AI yang boleh dipercayai dan telus.
Menuju Ekosistem AI Bersatu
Dengan menggabungkan pendekatan dipacu data sintetik Nemotron-4 340B dengan platform Cosmos WFM baharu, NVIDIA menetapkan laluan bersatu untuk AI yang merangkumi penyelidikan, penggunaan perusahaan dan automasi fizikal Llama Nemotron dan keluarga Cosmos Nemotron mengisi peranan penting dalam AI agen, manakala Cosmos WFM menangani kerumitan. robotik dan pembangunan kenderaan autonomi.
Daripada membolehkan penjanaan data kos efektif kepada menawarkan perkhidmatan mikro khusus untuk tugasan bahasa dan penglihatan masa nyata, portfolio terbaharu NVIDIA menunjukkan strategi serba boleh untuk kemajuan AI. Memandangkan lebih banyak perusahaan, pembangun dan penyelidik mengguna pakai model ini, trajektori untuk sistem autonomi dan ejen perisian pintar kelihatan bersedia untuk mempercepatkan.