Nvidia kini menghantar DGX Spark, sistem desktop padat yang disebut”superkomputer AI terkecil di dunia.”Mesin yang kuat dijual pada hari Rabu, 15 Oktober, dengan harga akhir $ 3,999. Langkah ini menandakan usaha strategik untuk mendemokrasikan pembangunan AI mewah.

Bertujuan untuk pemaju, penyelidik, dan pelajar, DGX Spark direka untuk mengalihkan beban kerja AI yang kompleks dari awan ke stesen kerja tempatan. Ia menyediakan prestasi peringkat pusat data untuk membina dan menguji model AI lanjutan secara langsung di atas meja, melangkaui kebergantungan awan biasa.

Strategi ini secara langsung mencabar model awan pertama yang telah menguasai pembangunan AI. Dengan memindahkan pengiraan ke tepi, Nvidia bertujuan untuk menangkap segmen pasaran kecewa dengan yuran egress data, kelemahan keselamatan, dan pengebilan awan yang tidak dapat diramalkan untuk kerja berulang yang intensif.

href=”https://nvidianews.nvidia.com/news/nvidia-dgx-spark-arrives-for-worlds-ai-developers”target=”_ blank”> Hand-delivered unit awal kepada Elon Musk di SpaceX . Acara ini dengan sengaja menyuarakan penghantaran DGX-1 yang pertama ke Musk di Openai, sebuah mesin yang membuktikan penting dalam pembangunan AI moden. PC biasa dan stesen kerja. Ini memaksa pemaju ke persekitaran awan atau pusat data yang mahal dan kadang-kadang ketat.

Dengan meletakkan kuasa pengiraan yang besar di dalam negara, Nvidia memberi kuasa kepada individu untuk berinovasi tanpa latensi, kebimbangan privasi data, atau kos berulang yang berkaitan dengan perkhidmatan awan. Bagi penyelidik, ini adalah peralihan yang ketara. Kyunghyun Cho dari Lab Frontier Global NYU menyatakan,”DGX Spark membolehkan kami mengakses pengkomputeran skala peta di desktop kami.”Kebolehcapaian ini adalah kunci kepada visi Nvidia. Potensi untuk lelaran yang cepat dan tempatan adalah penukar permainan untuk projek-projek yang kompleks. Reka bentuk CPU-GPU hibrid ini direka bentuk untuk kecekapan pembelajaran mesin, menyampaikan sehingga satu petaflop prestasi AI.

Sistem ini mempunyai 128GB memori bersatu, dikongsi antara CPU dan GPU. Ini didayakan oleh NVIDIA NVLINK-C2C Interconnect, yang menyediakan lima kali jalur lebar PCIe generasi kelima standard, mengurangkan kesesakan pemindahan data yang dapat melambatkan pengiraan AI.

Senibina memori bersatu adalah inovasi utama. Ia membolehkan CPU dan GPU mengakses kolam data yang sama tanpa pemindahan perlahan di seluruh bas PCIe. Bagi pemaju dengan dataset besar-besaran, ini bermakna aliran kerja yang lebih lancar dan lebih cekap.

Perkakasan ini membolehkan Spark DGX untuk mengendalikan tugas yang menuntut, seperti menjalankan kesimpulan pada model AI dengan sehingga 200 bilion parameter atau model penalaan halus sebanyak 70 bilion parameter secara tempatan. Ia adalah tahap prestasi yang sebelum ini tidak dapat dibayangkan dalam faktor bentuk desktop.

Dari digit projek ke $ 3,999 realiti

Produk akhir tiba dengan harga yang lebih tinggi tetapi juga tumpuan yang lebih halus dan ekosistem perisian yang kukuh.

kenaikan harga kepada $ 3,999 mencerminkan kedudukannya sebagai alat khusus, berprestasi tinggi dan bukannya peranti pengguna. Ia menjalankan versi tersuai Ubuntu Linux dan dimuatkan dengan stack perisian AI penuh NVIDIA, termasuk akses kepada NVIDIA NIM microservices untuk pembangunan yang diperkemas. Pemaju boleh segera memulakan projek seperti menyesuaikan model penjanaan imej atau membina chatbots AI tanpa persediaan yang luas, satu titik yang diserlahkan oleh