Microsoft Azure 部署了世界上第一個超級計算機規模的 NVIDIA GB300 NVL72 集群,這是一個專門為其合作夥伴 OpenAI 構建的大型系統。

生產集群集成了 4,600 多個 NVIDIA 最新的 Blackwell Ultra GPU,為訓練和運行下一代 AI 模型提供了訓練和運行所需的強大動力。

此次部署, 位於微軟人工智能數據中心,代表著三大科技巨頭之間深度戰略聯盟的一個重要里程碑。它旨在大幅加速人工智能開發,使 OpenAI 能夠構建比以往更強大、更複雜的模型,從而鞏固各公司在競爭激烈的人工智能基礎設施競賽中的集體領先地位。

OpenAI 的新超級計算龐然大物

此次發布是高潮 微軟計劃將這個初始集群作為眾多集群中的第一個,其雄心勃勃的目標是在其全球數據中心擴展到數十萬個 Blackwell Ultra GPU,這是一個明確的信號 其長期人工智能戰略。

另請閱讀:一旦人工智能泡沫破滅,為什麼微軟可能成為最終贏家

這項巨額投資將在幾周而不是幾個月內實現模型訓練,並支持具有數百萬億參數的模型的開發。

微軟公司副總裁 Nidhi Chappell 表示,“合作有助於確保客戶 像 OpenAI 一樣,可以以前所未有的規模和速度部署下一代基礎設施。”

微軟和 Nvidia 表示,它為生產規模的 AI 超級計算樹立了新的行業基準。

幕後花絮:GB300 NVL72 集群內部

超級計算機的核心是 NVIDIA 液冷、機架級 GB300 NVL72 系統,該架構於 2025 年 3 月在 GTC 上亮相。每個單元將 72 個 Blackwell Ultra GPU 和 36 個 Grace CPU 集成到一個單一的內聚系統中。

這種密集設計提供 1.44 exaflops 的 FP4 計算,並為每個系統提供統一的 37TB 快速內存池。內置液體冷卻對於管理如此高密度配置的巨大熱輸出至關重要,從而實現持續的峰值性能。

為了將 4,600 多個 GPU 連接到一台聚合的超級計算機中,該集群使用了複雜的兩層網絡架構。在每個機架內,NVIDIA 的第五代 NVLink 結構提供 130 TB/s 的全對全帶寬。這有效地將 72 個 GPU 轉變為具有共享內存的具有共享內存的單個大型加速器 池

為了跨整個集群進行通信,Microsoft 部署了 NVIDIA 的 Quantum-X800 InfiniBand 平台。 這種非阻塞、 fat-tree 結構可確保每個 GPU 800 Gb/s 帶寬的無縫高速通信,這是在跨數千個處理器訓練超大型模型時最大限度地減少開銷的關鍵組件。

AI 軍備競賽:戰略力量博弈

雖然 Microsoft 的部署是迄今為止規模最大的,但它是在專業雲提供商的早期舉措之後進行的 核心編織。 2025 年 7 月,CoreWeave 成為第一家將 GB300 平台投入商業化的公司,從而在市場上獲得了關鍵的先發優勢。

然而,微軟的公告謹慎地強調了其集群的“大規模生產”性質,標誌著其工業化和容量達到了新的水平,這與早期的小型部署有所不同。

這一舉措首先驗證了微軟的戰略支點 據 2024 年底報導,優先考慮 GB300,而不是其推遲發布的前身 GB200。這次成功部署標誌著在人工智能基礎設施軍備競賽中的主導地位,增強了該公司在與雲競爭對手的競爭中的地位。

NVIDIA 超大規模和高性能計算副總裁 Ian Buck 強調了該系統對整個領域的重要性,他表示:“這個聯合設計的系統提供了世界上第一個大規模 GB300 生產集群,提供了超級計算能力 OpenAI 服務數万億參數模型所需的引擎。”

它展示了該平台作為前沿 AI 研究和開發領先引擎的作用。

超越 Blackwell:NVIDIA 的加速路線圖

Blackwell 架構代表了當前 AI 加速領域的最先進水平。 NVIDIA 首席執行官黃仁勳強調了其對人工智能推理工作負載的深遠影響,並指出:“Blackwell Ultra NVL72 極大地加速了人工智能推理工作負載,即使在最大的模型上也能實現近乎瞬時的響應。”

然而,即使其旗艦平台已大規模部署,該公司也已經在展望下一次重大架構飛躍。

NVIDIA 積極的路線圖現在指向 Vera Rubin 平台,預計將於 2026 年末推出。這種未來架構將引入更多專業化,例如最近發布的 Rubin CPX 協處理器,這是一款專用芯片,旨在加速 AI 推理的計算密集型“上下文階段”。

這種“分解推理”策略標誌著市場正在超越 單片通用 GPU。通過為人工智能工作流程的特定部分創建專用硬件,NVIDIA 正在構建更深的競爭護城河。這種不懈的創新步伐凸顯了人工智能硬件市場的成熟。

目前,微軟-NVIDIA-OpenAI 聯盟已經為定義人工智能下一個時代的基礎設施制定了新標準。

Categories: IT Info