เห็นได้ชัดว่า Microsoft กำลังพัฒนาเครื่องมือซอฟต์แวร์ใหม่เพื่อใช้งานซอฟต์แวร์ AI ของ NVIDIA บนชิป AMD ที่มีราคาถูกกว่า ตามความคิดเห็นจากพนักงานที่ถูกกล่าวหาซึ่งปรากฏในสัปดาห์นี้
การลดค่าใช้จ่ายที่สูงของปริมาณงาน AI หรือที่เรียกว่าการอนุมาน จะท้าทายการครอบงำที่มีมายาวนานของ NVIDIA โดยตรง
มีรายงานว่าเครื่องมือดังกล่าวจะทำงานโดยการแปลงโค้ดจากแพลตฟอร์ม CUDA ที่เป็นกรรมสิทธิ์ของ NVIDIA เป็นรูปแบบ ROCm แบบโอเพ่นซอร์สของ AMD หากเป็นจริง กลยุทธ์ดังกล่าวจะสะท้อนแนวโน้มของอุตสาหกรรมในวงกว้าง เนื่องจากยักษ์ใหญ่ด้านเทคโนโลยีอย่าง Oracle และ OpenAI เพิ่มการพึ่งพาฮาร์ดแวร์ของ AMD เพื่อส่งเสริมการแข่งขัน
อาวุธลับที่ต่อต้านการครอบงำ AI ของ NVIDIA
การอ้างสิทธิ์ของชุดเครื่องมือใหม่นี้เกิดจากการถอดเสียงที่เผยแพร่ทางออนไลน์ ซึ่งแม้จะไม่ได้รับการยืนยันจาก Microsoft แต่ดูเหมือนว่าจะมาจาก hte ฟอรัม Third Bridge ซึ่งเป็นเครือข่ายผู้เชี่ยวชาญที่มีชื่อเสียงที่ให้สัมภาษณ์แบบเพย์วอลล์แก่ลูกค้าสถาบัน
ในรายงานดังกล่าว บุคคลนิรนามซึ่งถือว่าเป็นผู้เชี่ยวชาญของ Microsoft อ้างว่าบริษัทกำลังทำงานอย่างแข็งขันเพื่อลดช่องว่างระหว่างซอฟต์แวร์ที่เป็นกรรมสิทธิ์ของ NVIDIA และฮาร์ดแวร์ของคู่แข่ง
ในการถอดเสียง ที่แชร์ผ่านภาพหน้าจอบน X ผู้บรรยายอ้างว่ามีอยู่ของโครงการภายในที่ออกแบบมาเพื่อแก้ไขปัญหานี้ ท้าทายตรงหน้า
“ในช่วงสามถึงสี่เดือนที่ผ่านมา มีความสนใจมากขึ้นในการประหยัดต้นทุนด้วยอนุมาน เราได้สร้างชุดเครื่องมือบางอย่างเพื่อช่วยแปลงโมเดล CUDA เป็น ROCm เพื่อให้คุณสามารถใช้กับ AMD ได้ เช่น 300X
เรามีคำถามมากมายเกี่ยวกับเส้นทางของเรากับ AMD, 400X และ 450X เรากำลังทำงานอย่างแข็งขันร่วมกับ AMD ในเรื่องนี้เพื่อดู ความท้าทายที่ใหญ่ที่สุดที่ฉันกำลังเผชิญอยู่ในตอนนี้ โดยเฉพาะอย่างยิ่งกับเซิร์ฟเวอร์รุ่นใหม่ ๆ คือการค้นหาความหนาแน่นที่ชั้นวางและรับการระบายความร้อนด้วยของเหลวที่ชั้นวาง”
โพสต์ในฟอรัม Alledged Third Bridge (ที่มา: @Jukanlosreve/X)
ชุดเครื่องมือดังกล่าวจะทำหน้าที่เป็นเลเยอร์การแปลได้อย่างมีประสิทธิภาพ ช่วยให้โมเดล AI ที่สร้างขึ้นมาสำหรับระบบนิเวศของ NVIDIA ทำงานบนฮาร์ดแวร์ของ AMD โดยไม่ต้องเขียนใหม่ทั้งหมดและมีค่าใช้จ่ายสูง
สำหรับ หลายปีที่ผ่านมา แพลตฟอร์ม CUDA ของ NVIDIA เป็นทั้งเครื่องมือที่ทรงพลังและเป็นเสมือนกรงทองสำหรับนักพัฒนา AI ในฐานะ แพลตฟอร์มการประมวลผลแบบคู่ขนานที่มีไลบรารีที่แข็งแกร่งทำให้เป็นมาตรฐานอุตสาหกรรม CUDA ได้สร้าง”คูน้ำ”อันทรงพลังซึ่งทำให้คู่แข่งได้รับส่วนแบ่งการตลาดได้ยาก
หากได้รับการยืนยัน ความพยายามของ Microsoft จะเป็นการโจมตีคูน้ำนั้นโดยตรง แม้ว่า ROCm ของ AMD จะเป็นทางเลือกโอเพ่นซอร์สที่มีความสามารถ แต่เส้นทางการแปลงที่เชื่อถือได้จะช่วยให้ลูกค้า Azure ของ Microsoft ได้รับประโยชน์ด้านต้นทุนของฮาร์ดแวร์ AMD โดยไม่ต้องละทิ้งสภาพแวดล้อม CUDA ที่คุ้นเคย
ตัวเลือกในการรัน CUDA ด้วยชิป AMD มีอยู่แล้ว เช่น Toolchain GPGPU ของ SCALE อย่างไรก็ตาม การสูญเสียประสิทธิภาพเนื่องจากการแปลงยังคงเป็นอุปสรรคอย่างต่อเนื่องที่ Microsoft ต้องการจัดการ
การเล่นที่ประหยัดต้นทุนสำหรับบูมการอนุมาน AI
ได้รับแรงหนุนจากค่าใช้จ่ายที่เพิ่มขึ้นอย่างมากในการดำเนินงานของ AI ทำให้ยักษ์ใหญ่ด้านเทคโนโลยีกำลังดำเนินการตามมาตรการประหยัดต้นทุนอย่างจริงจัง ผู้บรรยายในข้อความถอดเสียงเน้นว่าแรงจูงใจหลักเบื้องหลังชุดเครื่องมือที่ถูกกล่าวหานั้นเป็นเรื่องทางการเงิน โดยเฉพาะอย่างยิ่งสำหรับขั้นตอนการอนุมานของ AI ซึ่งมีการนำโมเดลที่ผ่านการฝึกอบรมมาใช้งาน
เนื่องจากบริการ AI ขยายไปสู่ผู้ใช้หลายล้านคน การอนุมานจึงทำให้เกิดต้นทุนการดำเนินงานเป็นส่วนใหญ่
ความสนใจที่เพิ่มขึ้นในด้านประสิทธิภาพด้านต้นทุนทำให้ GPU ที่มีราคาแข่งขันของ AMD เป็นทางเลือกที่น่าสนใจแทนฮาร์ดแวร์ราคาพรีเมียมของ NVIDIA โดยมีเงื่อนไขว่าสามารถเอาชนะอุปสรรคด้านซอฟต์แวร์ได้
เหนือกว่า ต้นทุนซอฟต์แวร์และชิป ข้อจำกัดทางกายภาพของศูนย์ข้อมูลกำลังกลายเป็นปัญหาคอขวดที่สำคัญ แหล่งที่มาในการถอดเสียงตั้งข้อสังเกตว่าความท้าทายพื้นฐานไม่ได้เป็นเพียงการจัดหาไฟฟ้าให้เพียงพออีกต่อไป แต่การจัดการอย่างมีประสิทธิภาพ
การมุ่งเน้นไปที่ความหนาแน่นของพลังงานและการระบายความร้อนด้วยของเหลวเน้นย้ำถึงความต้องการอันมหาศาลของตัวเร่งความเร็ว AI รุ่นต่อไป
การผลักดันทั่วทั้งอุตสาหกรรมเพื่อทำลายการควบคุม CUDA Stranglehold
กลยุทธ์ที่ถูกกล่าวหาของ Microsoft จะสอดคล้องกับการผลักดันที่สำคัญทั่วทั้งอุตสาหกรรมเพื่อปลูกฝัง ห่วงโซ่อุปทานฮาร์ดแวร์ AI ที่มีการแข่งขันมากขึ้น สำหรับ NVIDIA ซึ่งเป็นผู้นำตลาดสร้างขึ้นจากซอฟต์แวร์มากพอๆ กับซิลิคอน แนวโน้มนี้แสดงถึงภัยคุกคามระยะยาว
Oracle ซึ่งเป็นผู้เล่นหลักในโครงสร้างพื้นฐานคลาวด์ เพิ่งประกาศความร่วมมือครั้งสำคัญในการปรับใช้ชิป AMD AI จำนวน 50,000 ตัว Karan Batta รองประธานอาวุโสของ Oracle Cloud ชี้ให้เห็นอย่างชัดเจนถึงคุณค่าของทางเลือกนี้สำหรับเวิร์กโหลดที่คำนึงถึงต้นทุน
ห้องปฏิบัติการวิจัย AI ชั้นนำ OpenAI กำลังดำเนินการอย่างเด็ดขาดเพื่อกระจายรากฐานการประมวลผลของตน บริษัทได้สร้างข้อตกลงขั้นสุดท้ายมูลค่าหลายพันล้านดอลลาร์กับ AMD เพื่อปรับใช้ GPU ขนาด 6 กิกะวัตต์
ความร่วมมือดังกล่าวรวมถึงการรับประกันเฉพาะสำหรับหุ้นสูงสุด 160 ล้านหุ้น ซึ่งอาจส่งผลให้ OpenAI ถือหุ้นประมาณ 10% ในผู้ผลิตชิป ซึ่งสอดคล้องกับเป้าหมายของพวกเขาอย่างลึกซึ้ง
แนวโน้มของ”ความร่วมมือ”นั้นขยายไปถึงคู่แข่งในประวัติศาสตร์ด้วยซ้ำ Intel กำลังเจรจาเพื่อผลิตชิปสำหรับ AMD โดยเน้นถึงความสำคัญเชิงกลยุทธ์ของห่วงโซ่อุปทานเซมิคอนดักเตอร์ที่หลากหลาย
หากคำกล่าวอ้างเกี่ยวกับชุดเครื่องมือของ Microsoft นั้นถูกต้อง บริษัทไม่เพียงแต่ทำงานเพื่อแก้ไขปัญหาต้นทุนภายในเท่านั้น แต่ยังมีส่วนช่วยในการพัฒนาตลาดในวงกว้างอีกด้วย เครื่องมือการแปลงที่ประสบความสำเร็จสามารถส่งสัญญาณถึงอนาคตของการพัฒนา AI ที่ไม่เชื่อเรื่องพระเจ้าด้วยฮาร์ดแวร์ ซึ่งช่วยให้นักพัฒนาไม่ต้องผูกมัดกับผู้ขาย
การเปลี่ยนแปลงที่อาจเกิดขึ้นดังกล่าวจะถือเป็นก้าวใหม่ของการเติบโตเต็มที่สำหรับอุตสาหกรรม AI ทั้งหมด โดยย้ายจากการประมวลผลที่บ้าคลั่งไปสู่ระบบนิเวศแบบหลายขั้วที่มีกลยุทธ์มากขึ้น