在高性能計算主導地位的爭奪戰中,AMD 正式推出了 Instinct MI430X 加速器,這是一款 432GB 系統,旨在支撐下一代西方超級計算機。

本週發布的新芯片利用海量 HBM4 內存帶寬來瞄準“主權 AI”基礎設施,確保在美國和歐洲的關鍵部署。通過將政府支持的百億億級系統優先於一般企業銷售,AMD 正在開闢一條對抗市場領導者 Nvidia 的戰略戰線,Nvidia 自己的路線圖在中國面臨著地緣政治阻力。

該行業正在競相打破 Nvidia 的束縛,微軟正在開發工具來彌合 CUDA 軟件差距。 AMD 的最新舉措正式確定了其硬件應對這一挑戰的答案,為尋求控制自己人工智能命運的國家提供了一種獨特的架構替代方案。

HBM4 和 19.6 TB/s 帶寬Leap

AMD本周正式詳細介紹了Instinct MI430X,將其定位為即將推出的MI400系列的旗艦產品。新架構的核心是 HBM4 內存的集成,將每個加速器的容量提高到 432GB。

推動吞吐量這一巨大飛躍的是內存帶寬的代際爆炸式增長,達到 19.6 TB/s。這一數字比當前 MI325X 的 6.0 TB/s 提高了 3.2 倍以上,解決了大型語言模型訓練的主要瓶頸。

AMD 數據中心 GPU 產品營銷高級總監 Mahesh Balasubramanian 在 官方博文表示,新芯片“開創了大規模人工智能和高性能計算 (HPC) 性能和效率的新時代。”

基於“下一代 CDNA”架構構建,被廣泛提及作為 CDNA 5,該芯片專門針對高性能計算 (HPC) 和人工智能工作負載的融合進行了優化。與犧牲精度以換取速度的純 AI 芯片不同,MI430X 保留了“真正基於硬件的 FP64″支持,這是需要雙精度精度的科學模擬的關鍵要求。

Balasubramanian 指出,“這些 GPU 基於下一代 AMD CDNA 架構構建,支持 432GB HBM4 內存和 19.6TB/s 內存帶寬,可提供非凡的計算能力”,並強調了

AMD 將該設備定位為“AI 工廠”的統一引擎,能夠同時處理訓練、推理和傳統建模,而無需單獨的集群。

電源效率仍然是核心設計支柱,但披露中明顯沒有具體的 TDP(熱設計功耗)數據。轉向 HBM4 標誌著製造複雜性的激增,可能需要先進的封裝技術來管理內存堆棧的熱密度。

“主權 AI”支點:保護西方超級計算機的安全

AMD 在“主權 AI”的旗幟下營銷芯片,明確針對美國和歐洲政府資助的基礎設施項目。這種有針對性的方法已經為 MI430X 在橡樹嶺國家實驗室 (ORNL) 即將推出的超級計算機“Discovery”中佔據一席之地。

根據 ORNL 公告,Discovery 預計交付2028 年,突顯了政府規模採購固有的較長交付時間。 Balasubramanian 解釋說,“Discovery 將使美國研究人員能夠訓練、微調和部署大規模人工智能模型,同時推進能源研究、材料科學和生成人工智能領域的科學計算。”

在歐洲,該芯片將為法國首個百億億級系統“Alice Recoque”提供動力,該系統是與 Eviden 合作建造的。 戰略合作夥伴公告確認該系統將利用 BullSequana XH3500 平台,將 MI430X 與 AMD 的下一代 EPYC“Venice”CPU 相結合。

專注於西方政府合同提供了穩定的收入底線,使 AMD 免受企業現貨市場波動的影響。從地緣政治角度來看,這與中國的情況形成鮮明對比,中國政府禁止在國家項目中使用外國芯片,從而有效地將 AMD 和 Nvidia 排除在該主權市場之外。

同時,美國政府最近批准了對中東的批准,創建了一個複雜的地緣政治地圖,其中“主權”市場由聯盟嚴格劃分。

市場現實:時間線差距和 CUDA護城河

雖然規格令人印象深刻,但 2026 年的發布窗口使 MI400 系列與 Nvidia 未來的“Rubin”架構而不是今天的 Blackwell 發生衝突。 Discovery 超級計算機的交付日期預計為 2028 年,這表明芯片可用性和大規模運營部署之間存在顯著滯後。軟件仍然是主要障礙,Nvidia 的 CUDA 生態系統仍然是行業的防禦護城河。

報告表明微軟正在開發翻譯工具來彌補這一差距,允許 CUDA 代碼在 AMD 硬件上本地運行而無需重寫。然而,這家雷德蒙德巨頭還通過授權 OpenAI 的定制芯片 IP 來對沖自己的賭注,這表明它不會僅僅依靠 AMD 來打破 Nvidia 的控制。

商用芯片市場也受到谷歌的擠壓,谷歌最近將其 Ironwood TPU 普遍提供給雲客戶。

非傳統參與者的崛起使競爭格局變得更加複雜。 Nvidia 首席執行官黃仁勳警告說,“低估中國的實力和華為令人難以置信的競爭精神是愚蠢的。這是一家擁有非凡技術的公司”,他承認市場正在分裂成區域領地。

對於企業客戶來說,AMD 開放生態系統和 Nvidia 集成堆棧之間的選擇通常取決於“基礎設施靈活性”與即時易用性。 AMD 相信,通過 MI430X,原始帶寬和政府驗證將足以扭轉局面。

Categories: IT Info