Google ได้เปิดตัวการประมวลผลเทนเซอร์ใหม่ที่เน้นประสิทธิภาพเป็นหลัก หน่วย (TPU) ที่เรียกว่า v5p มีจุดมุ่งหมายเพื่อลดเวลาที่ต้องใช้ในการฝึกโมเดลภาษาขนาดใหญ่ได้อย่างมาก จาก TPU v5e ที่ประกาศไปก่อนหน้านี้ v5p นำเสนอความสามารถในการคำนวณที่เพิ่มขึ้นอย่างโปร่งใสโดยกำหนดเป้าหมายความต้องการของปริมาณงาน AI ที่มีความเข้มข้นมากขึ้น
ประสิทธิภาพและความสามารถในการปรับขนาดที่ได้รับการปรับปรุง
TPU v5p โดดเด่นด้วยประสิทธิภาพ bfloat16 ที่น่าเกรงขามที่ 459 teraFLOPS หรือ 918 teraOPS เมื่อจัดการกับการคำนวณ Int8 มาพร้อมกับหน่วยความจำแบนด์วิธสูง 95GB และความเร็วการถ่ายโอนข้อมูล 2.76 TB/s ซึ่งเหนือกว่ารุ่นก่อนทั้งในด้านประสิทธิภาพและประโยชน์ใช้สอย การออกแบบของ Google ช่วยให้มีศักยภาพในการปรับขนาดที่น่าทึ่ง โดยมีหน่วย TPU v5p สูงถึง 8,960 หน่วยที่สามารถเชื่อมต่อภายในพ็อดเดียวผ่านการเชื่อมต่อระหว่างชิป 600 GB/s เมื่อเปรียบเทียบกับ TPU v5e แล้ว v5p มีขนาดคลัสเตอร์สูงสุดเพิ่มขึ้น 35 เท่า และขนาดคลัสเตอร์ TPU v4 ที่เป็นไปได้มากกว่าสองเท่า
[เนื้อหาที่ฝัง]
Mark Lohmeyer รองประธานฝ่ายโครงสร้างพื้นฐานด้านคอมพิวเตอร์และ ML ของ Google กล่าวว่าตัวเร่งความเร็วสามารถฝึกโมเดลภาษายอดนิยม เช่น GPT-3 ของ OpenAI ได้เร็วกว่าถึง 1.9 เท่าโดยใช้ BF16 ที่มีศักยภาพเพิ่มขึ้นถึง 2.8 เท่าสำหรับการคำนวณจำนวนเต็ม 8 บิต เมื่อเปรียบเทียบกับหน่วย TPU v4
ประสิทธิภาพระดับพรีเมียมมาพร้อมกับราคา
ความสามารถที่เพิ่มขึ้นของ TPU v5p ส่งผลต่อต้นทุน ลูกค้าสามารถคาดหวังอัตราต่อชั่วโมงที่ 4.20 ดอลลาร์ต่อตัวเร่ง TPU v5p ตรงกันข้ามกับ 3.22 ดอลลาร์สำหรับ TPU v4 และเพียง 1.20 ดอลลาร์สำหรับ TPU v5e Google วางตำแหน่ง v5e เป็นตัวเลือกที่คุ้มค่ากว่าสำหรับแอปพลิเคชันที่เวลาไม่ใช่ปัจจัยสำคัญยิ่ง ทำให้เป็นจุดเริ่มต้นที่เข้าถึงได้มากขึ้นสำหรับการฝึกอบรม AI โดยไม่จำเป็นต้องใช้ประสิทธิภาพขั้นสูงสุด
นอกเหนือจาก TPU v5p ใหม่แล้ว Google เปิดตัวแนวคิดใหม่ที่เรียกว่า”ไฮเปอร์คอมพิวเตอร์ AI”ซึ่งรวมฮาร์ดแวร์ ซอฟต์แวร์ เฟรมเวิร์กการเรียนรู้ของเครื่อง และโมเดลการใช้งานเพื่อจัดการกับปริมาณงาน AI อย่างมีประสิทธิภาพ ด้วยการเพิ่มประสิทธิภาพตัวแปรหลายตัวภายในระบบ สถาปัตยกรรมไฮเปอร์คอมพิวเตอร์ AI ของ Google พยายามที่จะกำจัดความไร้ประสิทธิภาพและปัญหาคอขวดทั่วไป มีแนวโน้มว่าจะเพิ่มประสิทธิภาพการทำงานในงาน AI ต่างๆ
นอกจากนี้ Google ยังได้เปิดตัว Gemini ซึ่งเป็นโมเดลภาษาขนาดใหญ่หลายรูปแบบที่เชี่ยวชาญด้านการประมวลผลข้อความ รูปภาพ วิดีโอ เสียง และแม้แต่โค้ด ซึ่งถือเป็นการประกาศความสำเร็จครั้งสำคัญใน AI ของ Google ความสามารถที่สอดคล้องกับการเปิดตัว TPU v5p ในสภาพแวดล้อมที่มีการแข่งขันสูงของการเร่งความเร็วของ AI ความก้าวหน้าของ Google กับ TPU v5p ทำให้เกิดความเป็นไปได้ใหม่ๆ สำหรับนักพัฒนาและธุรกิจที่ควบคุมพลังของปัญญาประดิษฐ์