🚀 Google 推出第 7 代 TPU「Ironwood」:單櫃 9,216 顆、能效翻倍,AI 代理的新底座來了!

更新 發佈閱讀 8 分鐘

嗨我是 Mech Muse 👋,今天要跟大家聊聊 Google 最新的 AI 加速器 —— 第七代 TPU「Ironwood」

這顆晶片不只是速度快,還能讓 AI 模型「更省電、更聰明地推論」,而且單一超級機櫃居然能塞進 9,216 顆晶片 🤯。

讀完這篇,你會搞懂 Ironwood 到底強在哪裡、它怎麼走到這一步、跟 NVIDIA 有什麼不一樣,最後再聊聊它對 AI 代理(AI Agents)時代代表什麼意義。


Ironwood 是什麼?為什麼它這麼重要 🔩

Google 的新一代 TPU(Tensor Processing Unit)代號 Ironwood,是他們第七代 AI 晶片,設計給「推論時代(Age of Inference)」使用。也就是說,這代晶片不只是訓練模型,而是針對 AI 服務運行階段 做最佳化——像是 Gemini、Claude、或 AI 代理執行時的能效與反應速度。

這代最驚人的亮點之一是:

👉 一個 superpod 可塞 9,216 顆 TPU,整體算力高達 42.5 ExaFLOPS(FP8 精度)

這意味著 Google 的雲端能同時支撐超大型模型(像 GPT-4 級別)或 MoE(Mixture of Experts,多專家模型)架構,延遲更低、效率更高。

在效能與能效上,Ironwood 相比上一代 Trillium(TPU v6e)提升約 4 倍效能能效(Perf/W)翻倍 💪。每顆晶片使用 192GB HBM3e 高頻寬記憶體7.4 TB/s 頻寬1.2 Tbps 晶片互連(ICI),是目前 Google 最強的 TPU。

它也被放進 Google 的 AI Hypercomputer 架構中,結合自家的 Pathways 軟體系統,讓數萬顆 TPU 像一台電腦一樣協作。而根據 The Verge 報導,Anthropic(Claude 的母公司)計畫用超過 100 萬顆 Ironwood TPU 來訓練與部署模型,可見業界期待多高!


Ironwood 的誕生與演進:時間線回顧 ⏳

📅 2025/4/9:Google 首次公開 Ironwood,宣布支援高達 9,216 顆晶片的超大規模配置,主打推論效能與能效。

📅 2025/4/10:技術文件曝光,揭露每顆 TPU 有 192GB HBM3e 記憶體與 1.2 Tbps ICI 互連頻寬。

📅 2025/8/25–26(Hot Chips 2025):更多細節揭露——單顆 TPU 的 FP8 峰值效能為 4,614 TFLOPs,整個 superpod 的共享記憶體可達 1.77PB

📅 2025/11/6(台北時間 22:48):The Verge 報導 Google 準備全面推出 Ironwood,一般可用(GA)版本即將開放。

📅 2025/11/7:Google Cloud 正式宣布 Ironwood GA,同步推出新一代 Arm 架構 Axion VM,可搭配使用。

📅 同週:外媒 The Register、MarketWatch 紛紛指出,Ironwood 將成為 NVIDIA 外最有實力的雲端選項之一,尤其在成本與能耗上更有優勢。

整體看下來,Ironwood 的推出節奏非常穩:從 4 月發表 → 8 月揭露硬體架構 → 11 月正式商轉,完全符合 Google 雲端的產品步調。


延伸分析:為什麼 Ironwood 對「AI 代理」時代特別關鍵 🤖

1️⃣ 代理(Agents)需要「記憶力」和「傳輸速度」

AI 代理已經不只是回答問題,而是能「理解上下文、規劃行動、與其他 AI 協作」的多步推理系統。

要做到這點,需要:

  • 超大量記憶體(例如長上下文、embedding 向量)
  • 極高的晶片間通訊速度

Ironwood 每顆配 192GB HBM3e、頻寬高達 7.4 TB/s,再加上 1.2 Tbps 的晶片互連,能讓超大模型即時交換資訊不卡頓。這對多代理協作或多模態推理非常關鍵。

2️⃣ 能效翻倍=更便宜的推論成本

在 AI 雲端裡,最大的支出往往是電力與散熱。Ironwood 相比前代效能提升 4 倍、能效提升 2 倍,代表同樣的耗電量能處理兩倍工作量。對於像 Gemini、Claude、Search 這種長期運行的 AI 系統,這是實質的降本。

換句話說,Ironwood 的推出讓「每度電能處理的 token 數量更多」,這才是雲端業者最在意的 KPI。

3️⃣ Pathways + Hypercomputer:Google 的隱形武器

Ironwood 不只是硬體升級,更搭配 Google 自家的 Pathways 分散式運算系統

它能自動在數千甚至上萬顆 TPU 間分配任務、同步記憶體、處理容錯,讓開發者不用手動優化,就能跑到大規模分散式架構。這對模型訓練和 AI 代理執行都非常省時。

4️⃣ 不是跟 NVIDIA 拼跑分,而是走不同路線

Ironwood 並不打算「取代 GPU」,而是成為 Google 雲端生態的專屬主力。

NVIDIA 的 H200 或 Blackwell 強在通用性和軟體生態,但 Google 的 TPU 在 雲端整合度與效能密度 上有優勢。

更棒的是,它能與新推出的 Axion VM(Arm 架構 CPU) 協同,把資料前後處理工作拆開,進一步降低延遲與成本。

這也是為什麼很多雲端 AI 公司會「混搭架構」——例如訓練用 GPU、推論用 TPU,既節省錢又能維持效能。


總結:Ironwood 正在為推論時代立新標準 🌐

一句話總結:

Ironwood 是 Google 為「AI 推論與代理時代」量身打造的超高效能基礎架構。

它的核心優勢包括:

✨ 單一 superpod 支援 9,216 顆晶片,總算力達 42.5 ExaFLOPS

⚡ 效能比前代提升 4 倍,能效翻倍

💾 支援 1.77PB 級共享記憶體,適合 MoE、長上下文任務

☁️ 與 Axion VM、Pathways 整合成完整的雲端生態

對開發者和企業來說,這意味著:

  • 想要訓練或部署大型模型,有更划算又穩定的選項
  • 想做 AI 代理、長上下文推理或多模型協作,延遲更低、成本更可控

如果你關注 AI 加速器、雲端算力或代理技術的發展,Ironwood 絕對是接下來幾年不能忽視的關鍵字。🔥


✨ 喜歡這類科技新知嗎?

歡迎追蹤我 Mech Muse 💡 我會繼續整理下一波 AI 推論硬體的走向,幫你在資訊爆炸的世界裡,抓到真正有用的趨勢 🚀

留言
avatar-img
Mech muse 智慧新知
64會員
885內容數
因為喜歡分享科技新知,所以創立這個部落格,目前主要分享人型機器人,偶爾分享一些AI、小型核能的最新趨勢,讓你即時掌握最新消息。 聯絡我:[email protected]
Mech muse 智慧新知的其他內容
2025/11/07
這篇文章帶你快速了解 OpenAI 執行長 Altman 最新澄清的重點:他談的不是政府要救 OpenAI,而是「晶片廠貸款擔保」;同時也曝光未來可能「直接賣算力」的新模式。讀完後你會清楚掌握這起爭議的真相、政策邏輯,以及未來 AI 基建發展方向。
Thumbnail
2025/11/07
這篇文章帶你快速了解 OpenAI 執行長 Altman 最新澄清的重點:他談的不是政府要救 OpenAI,而是「晶片廠貸款擔保」;同時也曝光未來可能「直接賣算力」的新模式。讀完後你會清楚掌握這起爭議的真相、政策邏輯,以及未來 AI 基建發展方向。
Thumbnail
2025/11/07
這篇文章帶你了解微軟最新的「人本超級智能(Humanist Superintelligence)」計畫,由 DeepMind 共同創辦人 Suleyman 主導。你會看到微軟如何以安全、可控為核心,從醫療診斷切入,打造「對人類真正有益」的超智能,並重新定義 AI 的未來方向。
Thumbnail
2025/11/07
這篇文章帶你了解微軟最新的「人本超級智能(Humanist Superintelligence)」計畫,由 DeepMind 共同創辦人 Suleyman 主導。你會看到微軟如何以安全、可控為核心,從醫療診斷切入,打造「對人類真正有益」的超智能,並重新定義 AI 的未來方向。
Thumbnail
2025/11/07
這篇文章會帶你了解 Meta 在歐洲推出的 AI 動態牆「Vibes」是什麼,為什麼它結合創作、版權與安全成為全球矚目的測試場。讀完後你會知道它的運作方式、技術背景、歐盟合規挑戰,以及對創作者與品牌的實際意義。
Thumbnail
2025/11/07
這篇文章會帶你了解 Meta 在歐洲推出的 AI 動態牆「Vibes」是什麼,為什麼它結合創作、版權與安全成為全球矚目的測試場。讀完後你會知道它的運作方式、技術背景、歐盟合規挑戰,以及對創作者與品牌的實際意義。
Thumbnail
看更多
你可能也想看
Thumbnail
Welcome to Next ‘25 2025 年的 Google Cloud Next 於 4 月 9 日至 11 日在美國拉斯維加斯盛大舉行,本次活動以「人工智慧」與「雲端基礎設施」為核心,推出了一系列令人振奮的技術突破,包括 Gemini 2.5 AI 模型、Ironwood 第七代 TP
Thumbnail
Welcome to Next ‘25 2025 年的 Google Cloud Next 於 4 月 9 日至 11 日在美國拉斯維加斯盛大舉行,本次活動以「人工智慧」與「雲端基礎設施」為核心,推出了一系列令人振奮的技術突破,包括 Gemini 2.5 AI 模型、Ironwood 第七代 TP
Thumbnail
這是一場修復文化與重建精神的儀式,觀眾不需要完全看懂《遊林驚夢:巧遇Hagay》,但你能感受心與土地團聚的渴望,也不急著在此處釐清或定義什麼,但你的在場感受,就是一條線索,關於如何找著自己的路徑、自己的聲音。
Thumbnail
這是一場修復文化與重建精神的儀式,觀眾不需要完全看懂《遊林驚夢:巧遇Hagay》,但你能感受心與土地團聚的渴望,也不急著在此處釐清或定義什麼,但你的在場感受,就是一條線索,關於如何找著自己的路徑、自己的聲音。
Thumbnail
OpenAI 日前推出名為 Codex 的雲端 AI 軟體工程 agent,專為程式設計任務進行改進,能自主完成撰寫功能、修復錯誤、執行測試及提交程式碼變更請求(pull request)。本文將介紹 Codex 的功能、應用場景及對程式設計行業的影響。
Thumbnail
OpenAI 日前推出名為 Codex 的雲端 AI 軟體工程 agent,專為程式設計任務進行改進,能自主完成撰寫功能、修復錯誤、執行測試及提交程式碼變更請求(pull request)。本文將介紹 Codex 的功能、應用場景及對程式設計行業的影響。
Thumbnail
《轉轉生》(Re:INCARNATION)為奈及利亞編舞家庫德斯.奧尼奎庫與 Q 舞團創作的當代舞蹈作品,結合拉各斯街頭節奏、Afrobeat/Afrobeats、以及約魯巴宇宙觀的非線性時間,建構出關於輪迴的「誕生—死亡—重生」儀式結構。本文將從約魯巴哲學概念出發,解析其去殖民的身體政治。
Thumbnail
《轉轉生》(Re:INCARNATION)為奈及利亞編舞家庫德斯.奧尼奎庫與 Q 舞團創作的當代舞蹈作品,結合拉各斯街頭節奏、Afrobeat/Afrobeats、以及約魯巴宇宙觀的非線性時間,建構出關於輪迴的「誕生—死亡—重生」儀式結構。本文將從約魯巴哲學概念出發,解析其去殖民的身體政治。
Thumbnail
技術債不是寫程式才有,它也藏在ERP報表、雲端流程、AI模型裡。這篇文章從日常系統操作出發,帶你看見那些「先這樣跑就好」背後的長期代價。看不見的債,總在你最忙的時候來討。
Thumbnail
技術債不是寫程式才有,它也藏在ERP報表、雲端流程、AI模型裡。這篇文章從日常系統操作出發,帶你看見那些「先這樣跑就好」背後的長期代價。看不見的債,總在你最忙的時候來討。
Thumbnail
OpenAI 和 Jony Ive 聯手打造的 AI 裝置,曾被視為下一個運算時代的開端,這款萬眾矚目的產品,卻面臨著驚人的挑戰。本文揭露第一代 AI 裝置的教訓,並為下一代邊緣裝置勾勒成功藍圖。想知道 AI 硬體的未來,以及如何避免重蹈覆轍?點進來,一起預見你的下一個智慧夥伴!
Thumbnail
OpenAI 和 Jony Ive 聯手打造的 AI 裝置,曾被視為下一個運算時代的開端,這款萬眾矚目的產品,卻面臨著驚人的挑戰。本文揭露第一代 AI 裝置的教訓,並為下一代邊緣裝置勾勒成功藍圖。想知道 AI 硬體的未來,以及如何避免重蹈覆轍?點進來,一起預見你的下一個智慧夥伴!
Thumbnail
本文分析導演巴里・柯斯基(Barrie Kosky)如何運用極簡的舞臺配置,將布萊希特(Bertolt Brecht)的「疏離效果」轉化為視覺奇觀與黑色幽默,探討《三便士歌劇》在當代劇場中的新詮釋,並藉由舞臺、燈光、服裝、音樂等多方面,分析該作如何在保留批判核心的同時,觸及觀眾的觀看位置與人性幽微。
Thumbnail
本文分析導演巴里・柯斯基(Barrie Kosky)如何運用極簡的舞臺配置,將布萊希特(Bertolt Brecht)的「疏離效果」轉化為視覺奇觀與黑色幽默,探討《三便士歌劇》在當代劇場中的新詮釋,並藉由舞臺、燈光、服裝、音樂等多方面,分析該作如何在保留批判核心的同時,觸及觀眾的觀看位置與人性幽微。
Thumbnail
背景:從冷門配角到市場主線,算力與電力被重新定價   小P從2008進入股市,每一個時期的投資亮點都不同,記得2009蘋果手機剛上市,當時蘋果只要在媒體上提到哪一間供應鏈,隔天股價就有驚人的表現,當時光學鏡頭非常熱門,因為手機第一次搭上鏡頭可以拍照,也造就傳統相機廠的殞落,如今手機已經全面普及,題
Thumbnail
背景:從冷門配角到市場主線,算力與電力被重新定價   小P從2008進入股市,每一個時期的投資亮點都不同,記得2009蘋果手機剛上市,當時蘋果只要在媒體上提到哪一間供應鏈,隔天股價就有驚人的表現,當時光學鏡頭非常熱門,因為手機第一次搭上鏡頭可以拍照,也造就傳統相機廠的殞落,如今手機已經全面普及,題
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News