NVIDIA hiện đang vận chuyển DGX Spark, một hệ thống máy tính để bàn nhỏ gọn được gọi là “siêu máy tính AI nhỏ nhất thế giới”. Chiếc máy mạnh mẽ này sẽ được bán vào thứ Tư tuần này, ngày 15 tháng 10, với mức giá cuối cùng là 3.999 USD. Động thái này báo hiệu một nỗ lực chiến lược nhằm dân chủ hóa hoạt động phát triển AI cao cấp.
Nhắm đến các nhà phát triển, nhà nghiên cứu và sinh viên, DGX Spark được thiết kế để chuyển khối lượng công việc AI phức tạp từ đám mây sang máy trạm cục bộ. Nó cung cấp hiệu suất ở cấp trung tâm dữ liệu để xây dựng và thử nghiệm các mô hình AI tiên tiến ngay trên bàn làm việc, bỏ qua các phần phụ thuộc thông thường vào đám mây.
Chiến lược này trực tiếp thách thức mô hình ưu tiên đám mây vốn thống trị hoạt động phát triển AI. Bằng cách chuyển hoạt động tính toán sang biên, NVIDIA hướng đến nắm bắt một phân khúc thị trường đang gặp khó khăn với phí đầu ra dữ liệu, lỗ hổng bảo mật và việc thanh toán trên đám mây không thể đoán trước cho công việc lặp đi lặp lại, chuyên sâu.
Lễ ra mắt được đánh dấu bằng cử chỉ mang tính biểu tượng của Giám đốc điều hành NVIDIA Jensen Huang, người đã giao tận tay một thiết bị đầu tiên cho Elon Musk tại SpaceX. Sự kiện này cố tình lặp lại việc giao DGX-1 đầu tiên cho Musk tại OpenAI vào năm 2016, một cỗ máy đã chứng tỏ vai trò then chốt trong sự phát triển của AI hiện đại.
Siêu máy tính AI cá nhân dành cho máy tính để bàn
Nhiệm vụ cốt lõi của DGX Spark là giải quyết một nút thắt ngày càng tăng: Khối lượng công việc AI đang nhanh chóng vượt xa khả năng bộ nhớ và phần mềm của các thiết bị thông thường PC và máy trạm. Điều này buộc các nhà phát triển phải sử dụng môi trường đám mây hoặc trung tâm dữ liệu tốn kém và đôi khi bị hạn chế.
Bằng cách đặt sức mạnh tính toán to lớn cục bộ, NVIDIA trao quyền cho các cá nhân đổi mới mà không gặp phải độ trễ, lo ngại về quyền riêng tư dữ liệu hoặc chi phí định kỳ liên quan đến dịch vụ đám mây. Đối với các nhà nghiên cứu, đây là một sự thay đổi đáng kể. Kyunghyun Cho của Phòng thí nghiệm biên giới toàn cầu của NYU lưu ý: “DGX Spark cho phép chúng tôi truy cập điện toán quy mô peta trên máy tính để bàn của mình”.
Hệ thống này nhắm đến nhiều đối tượng người dùng, từ các nhà nghiên cứu cá nhân đến các công ty khởi nghiệp AI nhỏ và các nhóm doanh nghiệp cần một cỗ máy chuyên dụng, an toàn để tạo nguyên mẫu và tinh chỉnh các mô hình độc quyền. Khả năng tiếp cận này là chìa khóa cho tầm nhìn của NVIDIA.
Huang trước đây đã tuyên bố rằng “việc đặt siêu máy tính AI trên bàn làm việc của mọi nhà khoa học dữ liệu, nhà nghiên cứu AI và sinh viên sẽ trao quyền cho họ tham gia và định hình thời đại AI”, coi DGX Spark như một công cụ để mở rộng sự tham gia vào cuộc cách mạng AI. Khả năng lặp lại cục bộ, nhanh chóng là yếu tố thay đổi cuộc chơi cho các dự án phức tạp.
[nội dung nhúng]
Under the Hood: The Power of Grace Blackwell
Trọng tâm của DGX Spark là kiến trúc NVIDIA Grace Blackwell, cụ thể là GB10 Grace Blackwell Superchip. Thiết kế kết hợp CPU-GPU này được thiết kế để mang lại hiệu quả học máy, mang lại hiệu suất AI lên tới một petaflop.
Hệ thống có 128GB bộ nhớ hợp nhất, được chia sẻ giữa CPU và GPU. Điều này được kích hoạt nhờ kết nối NVLink-C2C của NVIDIA, cung cấp băng thông gấp 5 lần so với PCIe thế hệ thứ năm tiêu chuẩn, giảm tắc nghẽn truyền dữ liệu có thể làm chậm quá trình tính toán AI.
Kiến trúc bộ nhớ hợp nhất là một cải tiến quan trọng. Nó cho phép CPU và GPU truy cập vào cùng một nhóm dữ liệu mà không cần truyền chậm qua bus PCIe. Đối với các nhà phát triển có bộ dữ liệu lớn, điều này có nghĩa là quy trình làm việc mượt mà và hiệu quả hơn.
Phần cứng này cho phép DGX Spark xử lý các tác vụ đòi hỏi khắt khe, chẳng hạn như chạy suy luận trên các mô hình AI có tới 200 tỷ tham số hoặc tinh chỉnh các mô hình lớn tới 70 tỷ tham số cục bộ. Đó là mức hiệu suất mà trước đây không thể tưởng tượng được ở dạng máy tính để bàn.
Từ Project Digits đến hiện thực trị giá 3.999 USD
Hành trình của DGX Spark bắt đầu tại CES 2025, nơi nó được giới thiệu với tên gọi “Project Digits”với mức giá dự kiến là 3.000 USD. Sản phẩm cuối cùng có mức giá cao hơn nhưng cũng có trọng tâm tinh tế hơn và hệ sinh thái phần mềm vững chắc hơn.
Việc tăng giá lên 3.999 USD phản ánh định vị của nó là một công cụ chuyên dụng, hiệu suất cao chứ không phải là một thiết bị tiêu dùng. Nó chạy phiên bản tùy chỉnh của Ubuntu Linux và được cài đặt sẵn bộ phần mềm AI đầy đủ của NVIDIA, bao gồm quyền truy cập vào các vi dịch vụ NVIDIA NIM để phát triển hợp lý.
Tính sẵn sàng “có sẵn” này là một phần quan trọng trong đề xuất giá trị của nó. Các nhà phát triển có thể bắt đầu ngay các dự án như tùy chỉnh mô hình tạo hình ảnh hoặc xây dựng chatbot AI mà không cần thiết lập rộng rãi, một điểm được nhấn mạnh bởi các đối tác truy cập sớm như Docker.
Hệ sinh thái, Tính sẵn có và sự áp dụng trong ngành
DGX Spark sẽ có sẵn để đặt hàng trực tiếp từ trang web của NVIDIA bắt đầu từ ngày 15 tháng 10. Nó cũng sẽ được bán thông qua nhiều đối tác OEM, đảm bảo khả năng tiếp cận thị trường rộng rãi. Các công ty bao gồm Acer, ASUS, Dell, GIGABYTE, HP, Lenovo và MSI đều chuẩn bị phát hành phiên bản của riêng họ.
Danh sách đầy đủ các đối tác OEM là rất quan trọng. Bằng cách tận dụng các kênh phân phối toàn cầu và bán hàng doanh nghiệp của các công ty như Dell và Lenovo, DGX Spark có thể thâm nhập thị trường vượt xa những gì NVIDIA có thể quản lý một mình, định vị nó như một tiêu chuẩn ngành.
Mặc dù không phải là một thiết bị tiêu dùng, nhưng DGX Spark tạo ra một phân khúc riêng gây áp lực lên những gã khổng lồ về đám mây như AWS và Google Cloud. Nó cung cấp một giải pháp thay thế hấp dẫn cho khối lượng công việc trong đó chủ quyền dữ liệu và chi phí cố định là tối quan trọng, có khả năng chuyển một số chi tiêu phát triển AI khỏi các dịch vụ đám mây.
NVIDIA cũng đã gieo mầm hệ sinh thái bằng cách cung cấp các đơn vị ban đầu cho các công ty phần mềm và tổ chức nghiên cứu quan trọng. Các đối tác như Google, Meta, Microsoft và Hugging Face đã tối ưu hóa các công cụ của họ cho nền tảng mới. DGX Spark là phiên bản nhỏ hơn của DGX Station mạnh hơn.
Sự hỗ trợ rộng rãi này rất quan trọng để áp dụng. Đối với các nhà nghiên cứu làm việc trên dữ liệu nhạy cảm, như trong lĩnh vực chăm sóc sức khỏe, khả năng làm việc tại địa phương là điều tối quan trọng. Cho giải thích: “Phương pháp mới này để tiến hành nghiên cứu và phát triển AI cho phép chúng tôi nhanh chóng tạo nguyên mẫu và thử nghiệm các mô hình và thuật toán AI tiên tiến — ngay cả đối với các ứng dụng nhạy cảm về quyền riêng tư và bảo mật, chẳng hạn như chăm sóc sức khỏe”, nhấn mạnh những lợi ích thiết thực ngoài hiệu suất thô. DGX Spark không chỉ là một phần cứng mới; đó là một nền tảng được thiết kế để khơi dậy làn sóng đổi mới AI tiếp theo.