思維外掛|AI 為什麼只能在封閉系統中可靠?|AlphaStar × 資料中心

更新 發佈閱讀 5 分鐘

從《星海爭霸》到 Google 資料中心:AI 如何走入現實世界的決策控制

課程背景

在 UC Berkeley CS294-196 (Fall 2025) 的課程中,Clay Bavor(Google 前副總裁、Sierra 共同創辦人)分享了他在 Google 生態系中,如何將研究團隊的成果轉化為可實際部署系統的經驗。這不僅是關於 AI 的演進,更是關於「如何讓 AI 在複雜系統中變得可靠」。


vocus|新世代的創作平台

如果你是《星海爭霸》(StarCraft II)的玩家,會對這段歷程感到格外親切;但即便不是玩家,也能從中理解 AI 從「遊戲行為」轉向「工業控制」的關鍵思維。

📌第一階段:AlphaStar 的技術突破

AlphaStar 是 DeepMind 於 2019 年發表的系統。與早期解決棋類遊戲的 AlphaZero 不同,AlphaStar 面對的是一個更接近現實的環境:高度複雜、不完全資訊、且為即時(非回合制)決策。

為了克服這些難題,AlphaStar 引入了核心機制:

聯盟訓練(League Training): 讓多個 Agent 彼此競爭,而非僅僅自我對弈。

剋星策略(Exploiters): 專門訓練一批 AI 來找現有最強策略的弱點,強迫系統不斷演化。

穩健性(Robustness): AlphaStar 顯示的關鍵點在於:在複雜系統中,單一的最優解通常是脆弱的,必須透過對抗訓練來培養在各種極端情境下(Corner Cases)都能存活的穩健策略。

AlphaStar 顯示,在高度複雜的對抗系統中,單一自我對戰容易收斂到脆弱策略,必須透過多樣化對手與刻意設計的對抗壓力,才能學到穩健行為。


📌第二階段:將技術「接地」——從電競到資料中心

看著AlphaStar 在遊戲內行雲流水,我的腦袋不禁思考:AI 這麼強,為什麼還沒變成 AGI(通用人工智能)?

雖然資料中心冷卻控制在時間線上早於 AlphaStar,且由不同的團隊負責,但它們在 Google 的 AI 發展史中共同指向同一個里程碑:做出在特定控制指標上,比人類經驗法則更穩健的決策。

關鍵在於「環境的邊界」。 StarCraft 是一個雖然複雜,但規則固定、可被高度工程化模擬的封閉系統。而在現實生活中,資料的混亂程度與使用者的隨機性,使得 AI 容易顯得「傻里傻氣」。

共通的訓練邏輯:

可建模的物理系統: 資料中心的溫度、電力負載與設備狀態可以被精準建模,形成一個「封閉且可模擬」的環境,這與遊戲引擎如出一轍。

長期策略大於即時優化: 冷卻控制不是只看當下的溫度,而是要預測未來負載對系統的影響。這與星海爭霸中的「長程布局(Long-horizon planning)」邏輯一致。

追求穩健而非投機: 就像 AlphaStar 要防範對手的怪招,冷卻系統必須在熱浪、設備故障或負載激增時依然保持安全,這就是「策略學習(Policy Learning)」的威力。

這種對複雜環境的『策略學習』,可能正是今日企業級 Agent 邁向實用的前身。


📌第三階段:AI Agent 的未來——Sierra 的企業級願景

Clay Bavor 離開 Google 後創辦了 Sierra,目標是將這套「可靠、穩健」的 Agentic AI 帶入企業環境。

Sierra 的核心產品是企業級 AI Agent 平台,在設計哲學上,它與 AlphaStar 的精神是一脈相承的:

Agentic Workflows(多步驟任務): 不再只是對話,而是像打星海一樣,能執行跨系統的長流程決策。

嚴格的 Policy(行為準則): 借鑒工業控制的經驗,為 LLM 設定嚴格的「護欄」,確保 AI 不會因隨機性而產生幻覺或違規。

可信任的部署: 它的目標不是讓 AI 看起來「更聰明」,而是讓 AI 在充滿變數的企業環境中,像冷卻系統一樣在明確邊界內可預期、可監控且可信賴。

---

前一陣子好忙~ 我回來啦 😚😚😚

留言
avatar-img
快樂,但可疑
2會員
14內容數
我在觀察人類,也在觀察人與AI的情緒互動。 兩者都在學習如何「理解情緒」——只是速度不同。 我寫自我覺察,也寫人機互動的覺察; 也許我們都還在同一堂「成為自己」的課上。
你可能也想看
Thumbnail
Google 公布「Project Suncatcher」,計畫把 AI 資料中心搬上太空,用太陽能供電、光學鏈路連結 TPU,2027 年將發射兩顆原型衛星驗證技術。本文帶你看這個構想的背景、時間線、技術挑戰與潛在影響。
Thumbnail
Google 公布「Project Suncatcher」,計畫把 AI 資料中心搬上太空,用太陽能供電、光學鏈路連結 TPU,2027 年將發射兩顆原型衛星驗證技術。本文帶你看這個構想的背景、時間線、技術挑戰與潛在影響。
Thumbnail
Google 擬在澳洲聖誕島建置 AI 資料中心,此舉不僅是雲端投資,更是 AI、國防、主權雲與區域基礎設施的戰略佈局。
Thumbnail
Google 擬在澳洲聖誕島建置 AI 資料中心,此舉不僅是雲端投資,更是 AI、國防、主權雲與區域基礎設施的戰略佈局。
Thumbnail
背景:從冷門配角到市場主線,算力與電力被重新定價   小P從2008進入股市,每一個時期的投資亮點都不同,記得2009蘋果手機剛上市,當時蘋果只要在媒體上提到哪一間供應鏈,隔天股價就有驚人的表現,當時光學鏡頭非常熱門,因為手機第一次搭上鏡頭可以拍照,也造就傳統相機廠的殞落,如今手機已經全面普及,題
Thumbnail
背景:從冷門配角到市場主線,算力與電力被重新定價   小P從2008進入股市,每一個時期的投資亮點都不同,記得2009蘋果手機剛上市,當時蘋果只要在媒體上提到哪一間供應鏈,隔天股價就有驚人的表現,當時光學鏡頭非常熱門,因為手機第一次搭上鏡頭可以拍照,也造就傳統相機廠的殞落,如今手機已經全面普及,題
Thumbnail
本文分析導演巴里・柯斯基(Barrie Kosky)如何運用極簡的舞臺配置,將布萊希特(Bertolt Brecht)的「疏離效果」轉化為視覺奇觀與黑色幽默,探討《三便士歌劇》在當代劇場中的新詮釋,並藉由舞臺、燈光、服裝、音樂等多方面,分析該作如何在保留批判核心的同時,觸及觀眾的觀看位置與人性幽微。
Thumbnail
本文分析導演巴里・柯斯基(Barrie Kosky)如何運用極簡的舞臺配置,將布萊希特(Bertolt Brecht)的「疏離效果」轉化為視覺奇觀與黑色幽默,探討《三便士歌劇》在當代劇場中的新詮釋,並藉由舞臺、燈光、服裝、音樂等多方面,分析該作如何在保留批判核心的同時,觸及觀眾的觀看位置與人性幽微。
Thumbnail
這是一場修復文化與重建精神的儀式,觀眾不需要完全看懂《遊林驚夢:巧遇Hagay》,但你能感受心與土地團聚的渴望,也不急著在此處釐清或定義什麼,但你的在場感受,就是一條線索,關於如何找著自己的路徑、自己的聲音。
Thumbnail
這是一場修復文化與重建精神的儀式,觀眾不需要完全看懂《遊林驚夢:巧遇Hagay》,但你能感受心與土地團聚的渴望,也不急著在此處釐清或定義什麼,但你的在場感受,就是一條線索,關於如何找著自己的路徑、自己的聲音。
Thumbnail
所有大咖 CSP 現在都已經進到「大量量產 AI 資料中心」階段,不再只是試水溫,2025–2027 是全球 AI 機房爆發期! 一、全球 AI 資料中心進度: 2025年 IEA 最新報告估計,光 AI 資料中心一年 CapEx 就逼近 5,80
Thumbnail
所有大咖 CSP 現在都已經進到「大量量產 AI 資料中心」階段,不再只是試水溫,2025–2027 是全球 AI 機房爆發期! 一、全球 AI 資料中心進度: 2025年 IEA 最新報告估計,光 AI 資料中心一年 CapEx 就逼近 5,80
Thumbnail
5 月將於臺北表演藝術中心映演的「2026 北藝嚴選」《海妲・蓋柏樂》,由臺灣劇團「晃晃跨幅町」製作,本文將以從舞台符號、聲音與表演調度切入,討論海妲・蓋柏樂在父權社會結構下的困境,並結合榮格心理學與馮.法蘭茲對「阿尼姆斯」與「永恆少年」原型的分析,理解女人何以走向精神性的操控、毀滅與死亡。
Thumbnail
5 月將於臺北表演藝術中心映演的「2026 北藝嚴選」《海妲・蓋柏樂》,由臺灣劇團「晃晃跨幅町」製作,本文將以從舞台符號、聲音與表演調度切入,討論海妲・蓋柏樂在父權社會結構下的困境,並結合榮格心理學與馮.法蘭茲對「阿尼姆斯」與「永恆少年」原型的分析,理解女人何以走向精神性的操控、毀滅與死亡。
Thumbnail
Google 近日與美國伊利諾州 Broadwing Energy 簽署購電協議 (PPA),採購新建應用碳捕捉與封存 (CCS) 技術的天然氣發電廠電力。此舉將使 Google 在中西部地區的資料中心能獲得穩定的低碳電力,並有助於推動 CCS 技術的商業化應用與普及。
Thumbnail
Google 近日與美國伊利諾州 Broadwing Energy 簽署購電協議 (PPA),採購新建應用碳捕捉與封存 (CCS) 技術的天然氣發電廠電力。此舉將使 Google 在中西部地區的資料中心能獲得穩定的低碳電力,並有助於推動 CCS 技術的商業化應用與普及。
Thumbnail
6個關鍵字 NVIDIA VR200(2026年推出) Kyber架構(2H27採用) HVLP4銅箔(2026年底需求1500噸) Q-glass纖維(2026年底需求900K平方米/月) CCL市場份額(盛宏科技GB300獲取份額) PCB TAM擴張(2027年195.7億美元)
Thumbnail
6個關鍵字 NVIDIA VR200(2026年推出) Kyber架構(2H27採用) HVLP4銅箔(2026年底需求1500噸) Q-glass纖維(2026年底需求900K平方米/月) CCL市場份額(盛宏科技GB300獲取份額) PCB TAM擴張(2027年195.7億美元)
Thumbnail
這篇文章幫你快速了解 Google 在德國的最新 AI 基礎建設布局 🚀。讀完後,你會清楚知道:Google 為什麼砸下 55 億歐元打造資料中心、這筆投資如何結合雲端運算與綠能供暖,以及這對歐洲 AI 發展與能源轉型代表什麼意義。
Thumbnail
這篇文章幫你快速了解 Google 在德國的最新 AI 基礎建設布局 🚀。讀完後,你會清楚知道:Google 為什麼砸下 55 億歐元打造資料中心、這筆投資如何結合雲端運算與綠能供暖,以及這對歐洲 AI 發展與能源轉型代表什麼意義。
Thumbnail
Google 在台北士林啟用「美國以外最大」的 AI 硬體工程中心,主要負責 TPU 與 AI 伺服器系統整合,研發成果將部署到全球資料中心。這次投資延續 Google 在台布局近 20 年的發展,強化台灣在 AI 供應鏈與資料中心架構中的關鍵角色,也讓台美科技合作進入更緊密的新階段。
Thumbnail
Google 在台北士林啟用「美國以外最大」的 AI 硬體工程中心,主要負責 TPU 與 AI 伺服器系統整合,研發成果將部署到全球資料中心。這次投資延續 Google 在台布局近 20 年的發展,強化台灣在 AI 供應鏈與資料中心架構中的關鍵角色,也讓台美科技合作進入更緊密的新階段。
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News