Google推出 TPU v5p Pod 提升 AI 模型訓練效率

Google 推出了一種以性能為中心的全新張量處理單元（TPU）稱為v5p，旨在大幅減少訓練大型語言模型所需的時間。 v5p 以先前發布的TPU v5e 為基礎，提高了運算能力，明顯滿足了更密集的AI 工作負載的需求。

增強的效能和可擴展性

在處理 Int8 計算時，TPU v5p 以其 459 teraFLOPS 或 918 teraOPS 的強大 bfloat16 效能脫穎而出。配備 95GB 高頻寬記憶體和 2.76 TB/s 的資料傳輸速度，在效率和實用性上都超越了前代產品。 Google 的設計具有顯著的擴展潛力，多達 8,960 個 TPU v5p 單元能夠透過 600 GB/s 晶片間互連在單一 Pod 內互連。與 TPU v5e 相比，v5p 的最大簇大小增加了 35 倍，潛在 TPU v4 簇大小增加了一倍多。

[嵌入內容]

Google 計算和機器學習基礎設施部門副總裁Mark Lohmeyer 表示，該加速器可以使用OpenAI 的GPT-3 等流行語言模型，速度提高1.9 倍BF16，與TPU v4 單元相比，8 位元整數運算的潛在增益高達2.8 倍。

卓越效能需要付出代價

TPU v5p 的增強功能確實會影響成本。客戶預計每個 TPU v5p 加速器的每小時費用為 4.20 美元，而 TPU v4 的每小時費用為 3.22 美元，TPU v5e 的每小時費用僅為 1.20 美元。對於時間不是最重要因素的應用程序，Google 將v5e 定位為更具成本效益的選擇，為AI 訓練提供了更容易訪問的切入點，而無需極高的性能。

除了新的TPU v5p，Google推出了一個名為「人工智慧超級電腦」的新概念，它整合了硬體、軟體、機器學習框架和消費模型，以有效地解決人工智慧工作負載。透過優化系統內的多個變量，Google的人工智慧超級運算架構旨在消除常見的低效率和瓶頸，有望提高各種人工智慧任務的生產力。

此外，Google還展示了Gemini，這是一種擅長處理文字、圖像、視訊、音訊甚至程式碼的多模態大語言模型，預示著Google人工智慧的一個重要里程碑這些功能與TPU v5p 的推出同時進行。在AI 加速競爭激烈的環境中，Google 在TPU v5p 上的進步為開發者和企業利用人工智慧的力量帶來了新的可能性。

Google推出 TPU v5p Pod 提升 AI 模型訓練效率

Published by All Things Windows on December 7, 2023

增強的效能和可擴展性

卓越效能需要付出代價

IT Info

Openai開發由Chatgpt AI Image Generator提供支持的社交媒體原型

IT Info

Google將VEO 2 AI視頻生成添加到雙子座高級訂閱

IT Info

Google Android安全更新延長鎖後引入了自動重新啟動

Google推出 TPU v5p Pod 提升 AI 模型訓練效率

Published by All Things Windows on December 7, 2023

增強的效能和可擴展性

卓越效能需要付出代價

Related Posts

IT Info

Openai開發由Chatgpt AI Image Generator提供支持的社交媒體原型

IT Info

Google將VEO 2 AI視頻生成添加到雙子座高級訂閱

IT Info

Google Android安全更新延長鎖後引入了自動重新啟動