Microsoft rõ ràng đang phát triển các công cụ phần mềm mới để chạy phần mềm AI của NVIDIA trên các chip AMD rẻ tiền hơn, theo nhận xét từ một nhân viên bị cáo buộc xuất hiện trong tuần này.
Việc cắt giảm chi phí cao của khối lượng công việc AI, còn được gọi là suy luận, sẽ trực tiếp thách thức sự thống trị lâu dài của NVIDIA.
Các công cụ như vậy được cho là sẽ hoạt động bằng cách chuyển đổi mã từ nền tảng CUDA độc quyền của NVIDIA sang định dạng ROCm nguồn mở của AMD. Nếu đúng, chiến lược này sẽ phản ánh một xu hướng rộng lớn hơn trong ngành, khi những gã khổng lồ công nghệ như Oracle và OpenAI ngày càng phụ thuộc vào phần cứng AMD để thúc đẩy cạnh tranh.
Vũ khí bí mật chống lại sự thống trị AI của NVIDIA?
Các tuyên bố về bộ công cụ mới bắt nguồn từ một bản ghi lưu hành trực tuyến, mặc dù chưa được Microsoft xác nhận nhưng dường như là từ hte Diễn đàn cầu nối thứ ba, một mạng chuyên gia có uy tín cung cấp các cuộc phỏng vấn có tường phí cho các khách hàng tổ chức.
Trong đó, một cá nhân ẩn danh được coi là chuyên gia của Microsoft cáo buộc công ty đang tích cực làm việc để thu hẹp khoảng cách giữa phần mềm độc quyền của NVIDIA và phần cứng của đối thủ cạnh tranh.
Trong bản ghi được chia sẻ qua ảnh chụp màn hình trên X, diễn giả khẳng định sự tồn tại của các dự án nội bộ được thiết kế để trực tiếp giải quyết thách thức này.
“Có trong ba đến bốn tháng qua, chúng tôi quan tâm nhiều hơn đến việc tiết kiệm chi phí bằng suy luận. Chúng tôi đã xây dựng một số bộ công cụ giúp chuyển đổi các mô hình CUDA sang ROCm để bạn có thể sử dụng nó trên AMD, như 300X
Chúng tôi đã có rất nhiều câu hỏi về lộ trình của chúng tôi với AMD, 400X và 450X. Chúng tôi đang tích cực làm việc với AMD về vấn đề đó để xem cách tối đa hóa thách thức đó. đang được áp dụng ngay bây giờ, đặc biệt là với các máy chủ mới hơn, chỉ đang tính toán mật độ trên giá và làm mát bằng chất lỏng trên giá.”
Bài đăng trên Diễn đàn cầu nối thứ ba bị cáo buộc (Nguồn: @Jukanlosreve/X)
Bộ công cụ như vậy sẽ hoạt động hiệu quả như một lớp dịch, cho phép các mô hình AI ban đầu được xây dựng cho hệ sinh thái của NVIDIA chạy trên phần cứng của AMD mà không yêu cầu viết lại hoàn chỉnh và tốn kém.
Trong nhiều năm, nền tảng CUDA của NVIDIA vừa là một nền tảng mạnh mẽ vừa là một chiếc lồng vàng cho AI nhà phát triển. Là một nền tảng điện toán song song có các thư viện mạnh mẽ đã biến nó thành tiêu chuẩn ngành, CUDA đã tạo ra một “con hào” mạnh mẽ khiến các đối thủ cạnh tranh khó giành được thị phần.
Nếu được xác nhận, nỗ lực của Microsoft sẽ là một cuộc tấn công trực tiếp vào con hào đó. Mặc dù ROCm của AMD là một giải pháp thay thế nguồn mở có khả năng, nhưng một lộ trình chuyển đổi đáng tin cậy sẽ cho phép khách hàng Azure của Microsoft đạt được lợi ích về chi phí của phần cứng AMD mà không phải từ bỏ môi trường CUDA quen thuộc.
Các tùy chọn để chạy CUDA với chip AMD đã có sẵn, chẳng hạn như Chuỗi công cụ GPGPU của SCALE hoặc href=”https://www.phoronix.com/news/ZLUDA-Q2-2025-Update”target=”_blank”>Công cụ ZLUDA, chặn các cuộc gọi CUDA. Tuy nhiên, các vấn đề về mất hiệu quả và ổn định do chuyển đổi/dịch thuật tiếp tục là một trở ngại đang diễn ra mà Microsoft rõ ràng muốn giải quyết.
Microsoft cũng ở vị thế độc nhất với đám mây Azure của mình để triển khai các bộ công cụ như vậy trong nội bộ, mang lại lợi ích về chi phí mà các đối thủ cạnh tranh của họ có thể không thể cung cấp.
Một giải pháp tiết kiệm chi phí cho sự bùng nổ suy luận AI
Được thúc đẩy bởi chi phí tăng vọt của các hoạt động AI, những gã khổng lồ công nghệ hiện đang ráo riết theo đuổi biện pháp tiết kiệm chi phí. Diễn giả trong bản ghi nhấn mạnh rằng động lực chính đằng sau bộ công cụ bị cáo buộc là tài chính, đặc biệt là cho giai đoạn suy luận của AI, nơi các mô hình đã được đào tạo được đưa vào hoạt động.
Khi dịch vụ AI mở rộng cho hàng triệu người dùng, suy luận chiếm một phần lớn chi phí hoạt động.
Mối quan tâm ngày càng tăng về hiệu quả chi phí khiến GPU có giá cạnh tranh hơn của AMD trở thành một giải pháp thay thế hấp dẫn cho phần cứng giá cao của NVIDIA, miễn là rào cản phần mềm có thể được khắc phục.
Ngoài chi phí phần mềm và chip, những hạn chế của trung tâm dữ liệu vật lý đang trở thành một nút cổ chai nghiêm trọng. Nguồn trong bản ghi lưu ý rằng thách thức cơ bản không còn chỉ là đảm bảo đủ điện mà còn là quản lý nó một cách hiệu quả.
Việc tập trung vào mật độ năng lượng và làm mát bằng chất lỏng nêu bật nhu cầu to lớn về nhà ở cho các máy gia tốc AI thế hệ tiếp theo.
Sự thúc đẩy toàn ngành nhằm phá vỡ vòng vây CUDA
Chiến lược được cho là của Microsoft sẽ phù hợp với nỗ lực đáng kể trên toàn ngành nhằm phát triển chuỗi cung ứng phần cứng AI cạnh tranh hơn. Đối với NVIDIA, công ty dẫn đầu thị trường dựa chủ yếu vào phần mềm cũng như silicon, xu hướng này thể hiện một mối đe dọa lâu dài.
Oracle, một công ty chủ chốt trong cơ sở hạ tầng đám mây, gần đây đã công bố mối quan hệ đối tác lớn để triển khai 50.000 chip AI AMD. Karan Batta, Phó chủ tịch cấp cao của Oracle Cloud, đã chỉ ra rõ ràng giá trị của giải pháp thay thế này đối với khối lượng công việc nhạy cảm với chi phí.
Phòng thí nghiệm nghiên cứu AI hàng đầu OpenAI cũng đang thực hiện những động thái mang tính quyết định nhằm đa dạng hóa nền tảng điện toán của mình. Nó đã ký một thỏa thuận trị giá hàng tỷ đô la dứt khoát với AMD để triển khai 6 gigawatt GPU của mình.
Quan hệ đối tác của nó bao gồm một bảo đảm duy nhất lên tới 160 triệu cổ phiếu, có thể mang lại cho OpenAI khoảng 10% cổ phần trong nhà sản xuất chip, điều chỉnh sâu sắc các mục tiêu của họ.
Xu hướng “hợp tác” đó thậm chí còn mở rộng đến cả các đối thủ lịch sử. Intel đang đàm phán để sản xuất chip cho AMD, nêu bật tầm quan trọng chiến lược của chuỗi cung ứng chất bán dẫn đa dạng.
Nếu những tuyên bố về bộ công cụ của Microsoft là chính xác thì công ty này không chỉ đang nỗ lực giải quyết vấn đề chi phí nội bộ mà còn góp phần vào sự phát triển thị trường rộng lớn hơn. Một bộ công cụ chuyển đổi thành công có thể báo hiệu một tương lai phát triển AI không phụ thuộc vào phần cứng, giải phóng các nhà phát triển khỏi sự ràng buộc của nhà cung cấp.
Sự thay đổi tiềm năng như vậy sẽ đánh dấu một giai đoạn trưởng thành mới cho toàn bộ ngành AI, chuyển từ việc chiếm lĩnh đất đai điện toán một cách điên cuồng sang một hệ sinh thái đa cực, mang tính chiến lược hơn.