Microsoft utvecklar uppenbarligen nya mjukvaruverktyg för att köra NVIDIAs AI-programvara på billigare AMD-chips, enligt kommentarer från en påstådd anställd som dök upp denna vecka.
Att minska de höga kostnaderna för AI-arbetsbelastningar, även känd som inferens, skulle direkt utmana NVIDIAs långvariga dominans.
Sådana plattformar skulle enligt NVIDIAs plattform fungera genom att konvertera kod. till AMD:s ROCm-format med öppen källkod. Om den stämmer skulle strategin spegla en bredare branschtrend, eftersom teknikjättar som Oracle och OpenAI ökar sitt beroende av AMD-hårdvara för att främja konkurrens.
Ett hemligt vapen mot NVIDIAs AI-dominans?
Påståenden om den nya verktygslådan kommer från en transkription som cirkulerar online som, även om den inte har bekräftats av Microsoft, verkar vara från
I transkriptet target=”https://x.com/Jukanlosreve/status/status/198094050000000000000″via skärmdump på X hävdade talaren att det fanns interna projekt som är utformade för att ta itu med den här utmaningen direkt.
“De senaste tre till fyra månaderna har det funnits ett mycket större intresse för att spara kostnader med slutledning. Vi byggde några verktygssatser för att hjälpa till att konvertera som CUDA-modeller till ROCm så att du kunde använda det på en AMD, som vi har haft många utrustningar i . om vad som är vår väg med AMD, 400X och 450X Vi arbetar aktivt med AMD för att se hur vi kan maximera det. Den största utmaningen jag skulle säga att vi stöter på just nu, särskilt med nyare servrar, är bara att ta reda på densiteten vid racket och få vätskekylning vid racket. Toolkit skulle effektivt fungera som ett översättningslager, vilket gör det möjligt för AI-modeller som ursprungligen byggdes för NVIDIAs ekosystem att köras på AMD:s hårdvara utan att kräva en fullständig och kostsam omskrivning.
I flera år har NVIDIAs CUDA-plattform varit både en kraftfull plattform och en gyllene bur för AI-utvecklare. Som en parallell datorplattform vars robusta bibliotek har gjort den till branschstandard, har CUDA skapat en kraftfull”vallgrav”som gör det svårt för konkurrenter att ta marknadsandelar.
Om det bekräftas skulle Microsofts insats vara ett direkt angrepp på den vallgraven. Även om AMD:s ROCm är ett kapabelt alternativ med öppen källkod, skulle en tillförlitlig konverteringsväg göra det möjligt för Microsofts Azure-kunder att få kostnadsfördelarna med AMD-hårdvara utan att överge den välbekanta CUDA-miljön.
Alternativ för att köra CUDA med AMD-chips är redan tillgängliga, som
Dess fokus på effekttäthet och vätskekylning belyser de enorma kraven på nästa generations AI-acceleratorer.
The Industry-Wide Push to Break the CUDA Stranglehold-strategin med en betydande, branschomfattande satsning för att odla en mer konkurrenskraftig AI-hårdvaruförsörjningskedja. För NVIDIA, vars marknadsledarskap bygger lika mycket på dess mjukvara som dess kisel, representerar denna trend ett långsiktigt hot.
Oracle, en nyckelspelare inom molninfrastruktur, tillkännagav nyligen ett stort partnerskap för att distribuera 50 000 AMD AI-chips. Karan Batta, Oracle Clouds Senior Vice President, pekade uttryckligen på värdet av detta alternativ för kostnadskänsliga arbetsbelastningar.
Det ledande AI-forskningslabbet OpenAI gör också avgörande steg för att diversifiera sin datorbas. Man slöt ett definitivt avtal på flera miljarder dollar med AMD för att distribuera 6 gigawatt av sina GPU:er.
Dess partnerskap inkluderar en unik teckningsoption för upp till 160 miljoner aktier, vilket skulle kunna ge OpenAI en cirka 10 % av aktierna i chiptillverkaren, vilket djupt anpassar deras målsättningar till och med”historia”.
“rivaler. Intel håller på att tillverka chips för AMD, vilket lyfter fram den strategiska betydelsen av en diversifierad halvledarförsörjningskedja.
Om påståendena om Microsofts verktygslåda är korrekta, arbetar företaget inte bara med att lösa ett internt kostnadsproblem utan bidrar till en bredare marknadsutveckling. En framgångsrik konverteringsverktygssats skulle kunna signalera en framtid av hårdvaruagnostisk AI-utveckling, vilket befriar utvecklare från leverantörslåsning.
Ett sådant potentiellt skifte skulle markera en ny mognadsfas för hela AI-branschen, som går från ett frenetiskt beräkningslandgrepp till ett mer strategiskt, multipolärt ekosystem.