ท่ามกลางการแข่งขันระดับโลกและแรงกดดันจากห่วงโซ่อุปทานฮาร์ดแวร์โดยเฉพาะอย่างยิ่งเกี่ยวกับการเข้าถึง GPU ที่มีประสิทธิภาพสูงประสิทธิภาพ AI ได้กลายเป็นจุดสนใจหลักสำหรับ บริษัท เทคโนโลยีหลายแห่ง
AI Deepseek ของจีนกำลังวางตำแหน่งตัวเอง ในช่วงไตรมาสที่ 4 ของปี 2024 มีการเรียกรายได้ในเดือนมีนาคม 2568 Tencent รายงานการลดความต้องการของ GPU โดยการรวมโมเดลของ Deepseek
ผู้บริหารของ บริษัท ระบุว่า“ บริษัท จีนมักจะจัดลำดับความสำคัญและการใช้ประโยชน์จากการใช้ประโยชน์ของการพัฒนา แสดงให้เห็นว่า-ความจริงนั้น”ในขณะที่ Tencent ยังคงจัดหาฮาร์ดแวร์เช่นชิป H20 ของ Nvidia สำหรับการรวมเข้าด้วยกันในแอพเช่น WeChat คำแถลงดังกล่าวเน้นการพึ่งพาเชิงกลยุทธ์ในการออกแบบที่มีประสิทธิภาพของ Deepseek
เราเป็นทีมเล็ก ๆ @deepseek_ai Exploring Agi เริ่มต้นสัปดาห์หน้าเราจะเปิดตัว repos 5 รายการแบ่งปันความคืบหน้าเล็ก ๆ แต่จริงใจของเราด้วยความโปร่งใสเต็มรูปแบบ
การสร้างที่ต่ำต้อยเหล่านี้ในบริการออนไลน์ของเราได้รับการบันทึกไว้…
-deepseek (@deepseek_ai)
การเรียกร้องประสิทธิภาพและรากฐานทางเทคนิค
580 TFLOPS แม้ว่าตัวเลขเหล่านี้จำเป็นต้องมีการตรวจสอบความเป็นอิสระในโลกแห่งความเป็นจริงในปริมาณงานที่หลากหลาย
ประสิทธิภาพที่ดีที่สุดรายงานว่าต้องใช้ CUDA 12.8 หรือใหม่กว่าแม้ว่าความเข้ากันได้เริ่มต้นที่ CUDA 12.3 พร้อมกับ Pytorch 2.0+ บริษัท ให้เครดิตแรงบันดาลใจจากโครงการที่จัดตั้งขึ้นเช่น flashattention 2 & 3 และ nvidia ของตัวเอง metax-maca/flashmla ), moore เธรด ( moorethreads/mt-flashmla ), hygon dcu target=”_ blank”> opendas/mlattention ), intellifusion ( intellifusion/tyllm ), iluvatar corex target=”_ blank”> deep-spark/flashmla ) และ amd สัญชาตญาณ href=”https://github.com/rocm/aiter/blob/main/aiter/mla.py”target=”_ blank”> aiter/mla ) แนะนำการเปิดตัวของระบบนิเวศที่มีความซับซ้อน ตามรายงานว่า Deepseek เร่งระยะเวลาการพัฒนาสำหรับโมเดลที่สำคัญต่อไป R2 ซึ่งเปลี่ยนจากการเปิดตัวพฤษภาคม 2568 ที่วางแผนไว้เป็นการเปิดตัวก่อนหน้านี้ตามที่รายงานในปลายเดือนกุมภาพันธ์
ความรีบเร่งนี้ไปสู่แรงกดดันจากผู้นำ AI การผสมผสานการเปลี่ยนแปลงของตลาดเหล่านี้เป็นความท้าทายด้านกฎระเบียบรวมถึงข้อ จำกัด ของสหรัฐอเมริกาและการตรวจสอบในยุโรปเกี่ยวกับการปฏิบัติข้อมูล นอกจากนี้การพึ่งพาฮาร์ดแวร์ Nvidia ของ Deepseek ยังคงเป็นปัจจัยหนึ่งเนื่องจากการควบคุมการส่งออกของสหรัฐอย่างต่อเนื่องส่งผลกระทบต่อความพร้อมใช้งานของชิปในประเทศจีน
ประสิทธิภาพตามความจำเป็นเชิงกลยุทธ์
Counts เส้นทางที่ได้รับการยกตัวอย่างโดยโมเดลที่ใช้ทรัพยากรอย่างเข้มข้นของ OpenAi เช่น GPT-4.5.5 ที่มีราคาแพง
ทิศทางนี้เป็นหลักฐานเพิ่มเติมจากการเปิดตัวที่เงียบสงบ href=”https://arxiv.org/abs/2504.02495″target=”_ blank”> กระดาษที่มีอยู่ใน arxiv ) เทคนิคการจัดตำแหน่งเวลาอนุมานที่มีแนวโน้มที่จะลดการพัฒนาของมนุษย์ สถาปัตยกรรมอาจสร้างความได้เปรียบในการแข่งขันในสภาพแวดล้อมที่มีทรัพยากรที่ จำกัด