今週明らかになった従業員とされる人物のコメントによると、Microsoft は明らかに、より安価な AMD チップで NVIDIA の AI ソフトウェアを実行するための新しいソフトウェア ツールを開発しているようです。
推論とも呼ばれる AI ワークロードの高コストを削減することは、NVIDIA の長年の優位性に直接挑戦することになります。
そのようなツールは、NVIDIA 独自の CUDA プラットフォームのコードを AMD のプラットフォームに変換することで機能すると伝えられています。オープンソースの ROCm 形式。これが本当であれば、この戦略は、Oracle や OpenAI などのテクノロジー大手が競争を促進するために AMD ハードウェアへの依存を強めていることから、より広範な業界のトレンドを反映したものとなるでしょう。
NVIDIA の AI 優位性に対する秘密兵器?
新しいツールキットの主張は、オンラインで出回っている記録に端を発していますが、Microsoft は未確認ですが、ペイウォールで保護されたインタビューを提供する信頼できる専門家ネットワークである Third Bridge Forum によるものと思われます。
その中で、マイクロソフトの専門家と考えられる匿名の人物は、同社が NVIDIA の独自ソフトウェアと競合他社のハードウェアとの間のギャップを埋めるために積極的に取り組んでいると主張しています。
トランスクリプト X のスクリーンショットで共有では、講演者は次のように述べています。この課題に正面から取り組むために設計された社内プロジェクトの存在を主張しました。
「ここ 3 ~ 4 か月間、推論によるコスト削減への関心が高まっています。私たちは 300X などの AMD で使用できるように、CUDA モデルのようなモデルを ROCm に変換するのに役立ついくつかのツールキットを構築しました。
AMD、400X、および現在、特に新しいサーバーで直面している最大の課題は、ラックの密度を把握し、ラックで液体冷却を実現することです。」
サード ブリッジ フォーラムの投稿 (出典: @Jukanlosreve/X)
このようなツールキットは、もともと NVIDIA のエコシステム用に構築された AI モデルを効果的に機能させることができます。
長年にわたり、NVIDIA の CUDA プラットフォームは、AI 開発者にとって強力なツールであると同時に黄金の檻でもありました。堅牢なライブラリが業界標準となっている並列コンピューティング プラットフォームとして、CUDA は競合他社が市場シェアを獲得することを困難にする強力な「堀」を作り出しました。
もし確認されれば、Microsoft の取り組みはその堀への直接攻撃となるでしょう。 AMD の ROCm は有能なオープンソースの代替手段ですが、信頼性の高い変換パスにより、Microsoft の Azure 顧客は使い慣れた CUDA 環境を放棄することなく AMD ハードウェアのコスト上のメリットを得ることができます。
SCALE の GPGPU ツールチェーンなど、AMD チップで CUDA を実行するオプションがすでに利用可能です。しかし、変換による効率の低下は依然として継続的な障害であり、Microsoft は明らかにそれに取り組みたいと考えています。
AI 推論ブームに向けたコスト削減策
AI 運用費用の膨張に押され、テクノロジー大手は現在、コスト削減策を積極的に追求しています。講演者はトランスクリプトの中で、疑惑のツールキットの背後にある主な動機は金銭的なものであること、特にトレーニングされたモデルが機能する AI の推論段階にあることを強調しました。
AI サービスが数百万のユーザーに拡大するにつれ、推論が運用コストの大きな部分を占めます。
コスト効率への関心の高まりにより、ソフトウェアの壁を乗り越えることができれば、より競争力のある価格の AMD の GPU が NVIDIA のプレミアム価格のハードウェアに代わる魅力的な代替品となります。
ソフトウェアとチップのコストを超えて、物理的なデータセンターの制約が重大なボトルネックになりつつあります。記録の情報源は、根本的な課題はもはや十分な電力を確保するだけでなく、それを効果的に管理することであると指摘しました。
電力密度と液体冷却に焦点を当てていることは、次世代 AI アクセラレータを収容するための膨大な需要を浮き彫りにしています。
CUDA の締め付けを打破するための業界全体の取り組み
Microsoft の主張されている戦略は、より競争力のある AI ハードウェア サプライ チェーンを育成するための業界全体の重要な取り組みと一致するでしょう。市場のリーダーシップがシリコンだけでなくソフトウェアにも大きく依存している NVIDIA にとって、この傾向は長期的な脅威を表しています。
クラウド インフラストラクチャの主要企業である Oracle は、最近、50,000 個の AMD AI チップを導入するための大規模な提携を発表しました。 Oracle Cloud の上級副社長であるカラン・バッタ氏は、コスト重視のワークロードにとってこの代替手段の価値を明確に指摘しました。
大手 AI 研究ラボである OpenAI も、コンピューティング基盤を多様化するために断固とした動きを行っています。同社は、6 ギガワットの GPU を導入するために AMD と数十億ドル規模の最終的な契約を締結しました。
そのパートナーシップには最大 1 億 6,000 万株の独自のワラントが含まれており、これにより OpenAI はチップメーカーの株式の約 10% を取得し、両社の目標は深く一致する可能性があります。
その「共同競争」の傾向は歴史的なライバルにまで及びます。 IntelはAMD向けチップの製造について交渉中で、多様化した半導体サプライチェーンの戦略的重要性を強調している。
Microsoftのツールキットに関する主張が正確であれば、同社は社内のコスト問題の解決に取り組んでいるだけでなく、より広範な市場の進化に貢献していることになる。変換ツールが成功すれば、ハードウェアに依存しない AI 開発の未来が到来し、開発者がベンダー ロックインから解放される可能性があります。
このような潜在的な変化は、AI 業界全体の成熟の新たな段階を示し、狂乱的なコンピューティングの土地収奪から、より戦略的な多極エコシステムへの移行を示すことになるでしょう。