TPU v5 系列:剖析 v5e 與 v5p 的差異,為 AI 訓練與推論打造最佳化解決方案

更新 發佈閱讀 4 分鐘

TPU v5 系列最大的創新在於產品線的分化,將晶片明確劃分為兩個版本,以滿足訓練與推論(Inference)市場中對極致效能成本效益的不同需求。

TPU v5 系列的核心是 v5ev5p,兩者基於相似的架構,但在性能、互連和 HBM 記憶體等方面有顯著差異。


1. 產品線分化:v5e (經濟) 與 v5p (效能) 🎯

特性Cloud TPU v5e (經濟/推理優化)Cloud TPU v5p (極致效能/訓練優化)設計目標成本效益最高、中大型訓練、推論 (Inference)極致效能、大規模基礎模型訓練 (LLMs)單晶片性能197 TFLOPS (bfloat16)~460 TFLOPS (bfloat16)HBM 容量16 GiB32 GiBPod 規模最大 256 晶片 (2D 環面)最大 8,960 晶片 (3D 環面)互連頻寬1600 Gbps/晶片4800 Gbps/晶片 (極高)定價價格比 v4 低於一半,性價比極高。價格較高,但訓練速度比 v4 快 2.8 倍。


2. v5e (v5-Economy):平民化 AI 訓練與推論

TPU v5e 是 Google 首次專門針對成本敏感型推論工作負載進行設計的版本。

  • 推論優化: v5e 支援高效能的 INT8 運算,這對 LLM(大型語言模型)的推論和服務至關重要。它在推論上的每美元性能比 v4 提升高達 2.5 倍。
  • 靈活的配置: v5e 支援從 1 個晶片到 256 個晶片的各種配置,靈活性更高,讓使用者能精確地匹配其工作負載規模,降低入門門檻。
  • 價格優勢: 旨在讓更多企業和團隊能夠以更低的成本運行中大型 AI 模型。

3. v5p (v5-Performance):極致規模與速度

TPU v5p 是針對要求最高性能的超大規模訓練所設計,接替 v4 成為 Google 的訓練旗艦晶片。

  • 性能躍升: 相比 TPU v4,v5p 的單晶片 FLOPS (浮點運算) 提升超過 2 倍,並擁有 3 倍的 HBM 記憶體頻寬。在 LLM 訓練上,速度提升約 2.8 倍。
  • 最大規模互連: v5p 將 TPU Pod 的最大規模從 v4 的 4096 晶片擴大到 8,960 晶片,並維持 v4 的 3D 環面拓撲,但將每個晶片的互連頻寬大幅提高至 4,800 Gbps。這保證了在近萬個晶片組成的集群中,數據傳輸和同步仍能保持極高效率。
  • 第二代 SparseCores: 繼承並升級了 v4 中引入的 SparseCore,對依賴大量嵌入層 (Embeddings) 的模型(如推薦系統)訓練速度比 v4 快 1.9 倍。

4. 總結創新:分工與效率

TPU v5 系列的核心創新是:

  1. 分工明確: 首次將晶片分為 v5p (性能/訓練) 和 v5e (成本/推論),允許客戶針對特定需求進行最佳化。
  2. 規模提升: v5p 將訓練 Pod 的規模推向新的高峰(8,960 晶片),鞏固 Google 在超大規模 AI 訓練基礎設施上的領先地位。

展望未來 (Trillium / v6)

Google 在 v5 之後已發布了下一代 TPU Trillium (或稱 v6)。 Trillium 在能源效率和單晶片性能上再次大幅躍升,宣稱性能比 v5e 提高 4.7 倍,將繼續沿著「極致效能」和「極致能效比」的方向發展。

留言
avatar-img
sirius數字沙龍
18會員
422內容數
吃自助火鍋啦!不要客氣,想吃啥,請自行取用!
你可能也想看
Thumbnail
本文分析導演巴里・柯斯基(Barrie Kosky)如何運用極簡的舞臺配置,將布萊希特(Bertolt Brecht)的「疏離效果」轉化為視覺奇觀與黑色幽默,探討《三便士歌劇》在當代劇場中的新詮釋,並藉由舞臺、燈光、服裝、音樂等多方面,分析該作如何在保留批判核心的同時,觸及觀眾的觀看位置與人性幽微。
Thumbnail
本文分析導演巴里・柯斯基(Barrie Kosky)如何運用極簡的舞臺配置,將布萊希特(Bertolt Brecht)的「疏離效果」轉化為視覺奇觀與黑色幽默,探討《三便士歌劇》在當代劇場中的新詮釋,並藉由舞臺、燈光、服裝、音樂等多方面,分析該作如何在保留批判核心的同時,觸及觀眾的觀看位置與人性幽微。
Thumbnail
這一兩年,AI 帶來的產業劇變速度之快,讓整個科技界猶如被按下「加速鍵」。從 PCB、散熱技術、機櫃軌道、交換器到伺服器供應鏈,短短時間內全都被 AI 推著往前走。而現在,這股巨浪正式推向了另一個過去不太起眼的主角——記憶體 其中,高頻寬記憶體(HBM)的全球缺料,更像是一把點燃產業鏈的野火;一旦
Thumbnail
這一兩年,AI 帶來的產業劇變速度之快,讓整個科技界猶如被按下「加速鍵」。從 PCB、散熱技術、機櫃軌道、交換器到伺服器供應鏈,短短時間內全都被 AI 推著往前走。而現在,這股巨浪正式推向了另一個過去不太起眼的主角——記憶體 其中,高頻寬記憶體(HBM)的全球缺料,更像是一把點燃產業鏈的野火;一旦
Thumbnail
11/19法說會中,黃仁勳的談話展現出強烈的信心與明確方向。他表示,輝達與全球供應鏈之間的合作早已緊密串聯,從晶圓製造、先進封裝,到記憶體供應商與系統ODM工廠,所有夥伴都「很早就知道輝達的需求」,並且提前做好產能配置,確保公司在AI熱潮中擁有穩定供應。  
Thumbnail
11/19法說會中,黃仁勳的談話展現出強烈的信心與明確方向。他表示,輝達與全球供應鏈之間的合作早已緊密串聯,從晶圓製造、先進封裝,到記憶體供應商與系統ODM工廠,所有夥伴都「很早就知道輝達的需求」,並且提前做好產能配置,確保公司在AI熱潮中擁有穩定供應。  
Thumbnail
5 月將於臺北表演藝術中心映演的「2026 北藝嚴選」《海妲・蓋柏樂》,由臺灣劇團「晃晃跨幅町」製作,本文將以從舞台符號、聲音與表演調度切入,討論海妲・蓋柏樂在父權社會結構下的困境,並結合榮格心理學與馮.法蘭茲對「阿尼姆斯」與「永恆少年」原型的分析,理解女人何以走向精神性的操控、毀滅與死亡。
Thumbnail
5 月將於臺北表演藝術中心映演的「2026 北藝嚴選」《海妲・蓋柏樂》,由臺灣劇團「晃晃跨幅町」製作,本文將以從舞台符號、聲音與表演調度切入,討論海妲・蓋柏樂在父權社會結構下的困境,並結合榮格心理學與馮.法蘭茲對「阿尼姆斯」與「永恆少年」原型的分析,理解女人何以走向精神性的操控、毀滅與死亡。
Thumbnail
資料來源: https://www.youtube.com/watch?v=i_nmyAeqRuE各位昨天被洗出場、今天看著大盤漲這這叫「搥心肝」的病友們,大家好!我是專治「信心不足骨質疏鬆」的骷髏醫生。💀🩺 今天台股大漲,摩爾投顧——何基鼎(GD)分析師 心情好到在節目上唱歌跳舞(真的
Thumbnail
資料來源: https://www.youtube.com/watch?v=i_nmyAeqRuE各位昨天被洗出場、今天看著大盤漲這這叫「搥心肝」的病友們,大家好!我是專治「信心不足骨質疏鬆」的骷髏醫生。💀🩺 今天台股大漲,摩爾投顧——何基鼎(GD)分析師 心情好到在節目上唱歌跳舞(真的
Thumbnail
這是一場修復文化與重建精神的儀式,觀眾不需要完全看懂《遊林驚夢:巧遇Hagay》,但你能感受心與土地團聚的渴望,也不急著在此處釐清或定義什麼,但你的在場感受,就是一條線索,關於如何找著自己的路徑、自己的聲音。
Thumbnail
這是一場修復文化與重建精神的儀式,觀眾不需要完全看懂《遊林驚夢:巧遇Hagay》,但你能感受心與土地團聚的渴望,也不急著在此處釐清或定義什麼,但你的在場感受,就是一條線索,關於如何找著自己的路徑、自己的聲音。
Thumbnail
背景:從冷門配角到市場主線,算力與電力被重新定價   小P從2008進入股市,每一個時期的投資亮點都不同,記得2009蘋果手機剛上市,當時蘋果只要在媒體上提到哪一間供應鏈,隔天股價就有驚人的表現,當時光學鏡頭非常熱門,因為手機第一次搭上鏡頭可以拍照,也造就傳統相機廠的殞落,如今手機已經全面普及,題
Thumbnail
背景:從冷門配角到市場主線,算力與電力被重新定價   小P從2008進入股市,每一個時期的投資亮點都不同,記得2009蘋果手機剛上市,當時蘋果只要在媒體上提到哪一間供應鏈,隔天股價就有驚人的表現,當時光學鏡頭非常熱門,因為手機第一次搭上鏡頭可以拍照,也造就傳統相機廠的殞落,如今手機已經全面普及,題
Thumbnail
HBM4 相較 HBM3 帶寬翻倍、效能提升,但成本高出六至七成。這場轉變讓 GPU 成本重心從算力移向記憶體,深刻改變 AI 經濟學。
Thumbnail
HBM4 相較 HBM3 帶寬翻倍、效能提升,但成本高出六至七成。這場轉變讓 GPU 成本重心從算力移向記憶體,深刻改變 AI 經濟學。
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News