近期,NVIDIA 執行長黃仁勳(Jensen Huang)參加了知名 podcast 節目《All-In Podcast》,與幾位重量級科技投資人進行了一場超過一小時的深度對談。從驚人地收購 AI 推理晶片新創 Groq、佈局 50 兆美元的物理 AI(Physical AI)市場、探討個人 AI 電腦的全新作業系統「OpenClaw」,一路談到地緣政治、供應鏈挑戰,以及企業如何為員工配置高達數十萬美元的「算力預算」。
Jensen Huang: Nvidia's Future, Physical AI, Rise of the Agent, Inference Explosion, AI PR Crisis從底層晶片到上層應用的全面顛覆
從 GPU 公司到 AI 工廠:為何收購 Groq 與推動「解聚合推理」?
一直以來,NVIDIA 憑藉強大的 GPU 稱霸模型訓練(Training)市場,但隨著市場重心轉向推理(Inference),運算的本質正在發生改變。黃仁勳指出,未來的 AI 基礎設施將由一個名為「Dynamo」的作業系統來驅動。這個命名的靈感來自於西門子在工業革命時期發明的發電機(Dynamo),象徵著將數據轉化為智能的引擎。而在 Dynamo 的核心,就是「解聚合推理(Disaggregated Inference)」的技術。
為什麼需要解聚合?因為在 Agent 時代,推理的 Pipeline 變得極度複雜。當你在運行一個 Agent 時,它需要頻繁存取短期工作記憶、長期記憶、使用外部工具,這會對儲存系統造成極大壓力。同時,資料中心內部充滿了各種不同形狀與大小的模型:大型語言模型、小型模型、擴散模型(Diffusion Models)、自迴歸模型等。
單一架構已經無法滿足這種多樣性。因此,NVIDIA 將推理過程拆解,讓不同的任務運行在最適合的晶片上。在未來的資料中心裡,大約有 25% 的空間將分配給 Groq LPU 與 NVIDIA GPU 的組合。NVIDIA 的產品線現在橫跨了 GPU、CPU、BlueField 儲存處理器、Mellanox 網路交換器,以及 Groq 的處理器。NVIDIA 的思維已經徹底從「賣晶片」升級為「提供完整的 AI 工廠基礎設施」。
Physical AI與 50 兆美元的產業轉型
過去的科技創新大多侷限在數位領域,但黃仁勳強調,AI 的下一個巨大機遇在於「Physical AI」,這是一個高達 50 兆美元、過去鮮少被科技深度介入的龐大市場。
為了解決Physical AI的挑戰,NVIDIA 提出了「三台電腦」的模型架構:
- 訓練電腦 (Training Computer):負責創造並訓練基礎 AI 模型。
- 模擬與評估電腦 (Omniverse):這是一個遵循物理定律的虛擬環境。機器人或自駕車在進入真實世界前,必須先在這個具備真實物理特性的虛擬環境中進行無數次的測試與評估。
- 邊緣電腦 (Edge Computer):部署在實體世界中的終端設備。它可以是一台自駕車、一個工廠機器人,甚至是一個能與孩童對話的泰迪熊。
更宏觀地看,黃仁勳提到將全球價值 2 兆美元的電信基礎設施(如 5G 基地台)轉變為 AI 基礎設施的延伸。未來的無線電設備將成為邊緣運算節點,讓 AI 算力如同水電一般無所不在。
Agent 時代的作業系統:OpenClaw 與全新的運算藍圖
在軟體層面,黃仁勳對近期開源社群中的「OpenClaw」給予了極高的評價。他認為這不只是一個新工具,而是「現代運算藍圖的重構」。
他將過去兩年 AI 的發展劃分為三個轉折點:
- 生成式 AI (Generative):以 ChatGPT 為代表,讓 AI 具備了直覺的使用者介面。
- 推理模型 (Reasoning):如 OpenAI 的 o1 與 o3 模型,透過內部思考(Thinking)機制,讓 AI 能夠提供更加精確、有根據的答案。
- 代理系統 (Agentic):由 Claude Code 等系統引領,AI 不再只是回答問題,而是能夠「執行工作」。
OpenClaw 之所以重要,是因為它具備了構成一台「電腦」的四大核心要素:
- 記憶體系統:擁有作為短期記憶的暫存檔系統。
- 技能庫 (Skills):能夠透過 API 呼叫各種應用程式與工具。
- 資源管理與排程:可以設定例行任務、拆解複雜任務,甚至衍生出子代理(Sub-agents)來協同解決問題。
- I/O 子系統:具備輸入與輸出能力,例如直接連接 WhatsApp 或讀寫本地端檔案。
當這四個元素結合在一起,且完全開源、能在本地端運行時,人類歷史上第一台「個人化人工智慧電腦」就此誕生。未來的軟體工程師不再是「寫程式」,而是提供想法、架構規格,並組織由上百個 AI Agent 組成的虛擬團隊來完成專案。
破除末日論與 AI 監管的現實考量
隨著 AI 能力呈現指數級增長,社會對 AI 的恐懼也隨之攀升,AI 在美國的民眾好感度一度降至 17%。針對近期 Anthropic 等公司與國防單位合作所引發的爭議,以及社會上的「AI 末日論」,黃仁勳強調,科技領袖有責任警告風險,但「警告(Warning)與恐嚇(Scaring)是完全不同的兩件事」。過度誇大那些缺乏證據的災難性後果,不僅無助於事,反而會對產業造成巨大傷害。他將這種情況與核能產業相比擬:美國因為恐懼而幾乎停滯了核能發展,導致如今在潔淨能源的競賽中落後。
黃仁勳直言:「AI 是一套電腦軟體,它不是生物,不是外星人,也不具備意識。我們對這項技術有著深刻的理解,而非一無所知。」他認為,美國國家安全最大的風險,絕對不是 AI 本身失控,而是美國因為恐懼與過度監管而放慢腳步,導致其他國家率先掌握並大規模應用這項技術。
地緣政治、供應鏈挑戰與全球化擴散
在談到中美科技戰與美國的出口管制政策時,黃仁勳展現了作為全球企業 CEO 的高度戰略思維。他坦言,目前 NVIDIA 在全球第二大市場(中國)的市佔率幾乎歸零,但他們正配合新政府的政策與許可,逐步恢復供應鏈運作。
「當我們無法掌控微型馬達、稀土礦物、電信網路或太陽能時,我們的國家安全是受損的。我們絕對不能讓 AI 產業步上這些後塵。」,黃仁勳認為,要確保美國在 AI 領域的絕對領先,最好的方式不是將技術封鎖在國內,而是讓「美國的科技堆疊(Tech Stack)」從底層晶片、系統架構到軟體平台,成為全世界 90% 以上國家建立自有 AI 的基礎設施。
針對臺灣的地緣政治風險,黃仁勳重申了 NVIDIA 的三大策略:
- 深化戰略夥伴關係:高度讚賞臺灣供應鏈的卓越貢獻,將其視為不可或缺的戰略夥伴,並給予極大的友誼與支持。
- 供應鏈多元化:積極在美國本土(亞利桑那、德州)、日本、韓國與歐洲擴展製造基地,增強系統韌性。
- 保持戰略耐心與克制:在確保韌性的同時,避免不必要的激進舉動。
開源模型與閉源模型的共存之道
黃仁勳明確表示:未來的 AI 世界,開源模型與閉源模型將並存,這是一個「A 加上 B」的必然結果,而非零和遊戲。
對於普通消費者或提供泛用型服務的平台,閉源模型(如 ChatGPT、Claude)以「產品即服務(Models as a product)」的形式存在,將繼續蓬勃發展。然而,對於需要深度整合領域知識、保護機密數據並完全掌握控制權的企業與行業來說,開源模型是唯一的解答。NVIDIA 正積極貢獻開源社群,確保企業能夠在基礎模型的之上,透過微調(Fine-tuning)打造出專屬於自己的護城河。
未來多個產業的結構性改變
有人擔心 AI 會摧毀企業軟體產業,但黃仁勳給出了相反的視角。傳統軟體受限於「人類坐在螢幕前的工作時間(Butts in seats)」,但未來將會有超過人類數量 100 倍的 Agent 在日以繼夜地操作 SQL 資料庫、Blender 3D 軟體、Photoshop 或 EDA(電子設計自動化)工具。這些現有的專業軟體將成為 Agent 輸出的管道,迎來使用量的大幅增長。
AI 正在推動數位生物學的「ChatGPT 時刻」。透過 AI 物理學(AI Physics),我們能夠模擬基因、蛋白質與細胞的動態,這將在未來 3 到 5 年內徹底顛覆新藥開發的流程。此外,未來醫院內的每一台檢測儀器都將內建 Agent,能夠即時輔助醫師診斷。這並不會取代醫療人員,就像電腦視覺導入放射科後,反而因為掃描效率提升,醫院能夠處理更多病患,進而導致放射科醫師的需求量大增。
NVIDIA 預測在未來的 3 到 5 年內,實用型的通用機器人將大量普及。黃仁勳用「司機」的演變來比喻未來的職場:當自駕車完全接管駕駛任務時,司機並不會失業,而是轉型為「行動助理」,在車輛自動行駛的同時,協助乘客處理行李、安排行程與其他高附加價值的服務。AI 將接管繁瑣的執行層面,而人類將專注於策略制定與創新。
TN科技筆記的觀點
訪談中最讓我深思的,是黃仁勳對工程師「Token 預算」的看法。他舉例,如果一位年薪 50 萬美元的頂尖工程師,一年只消耗了 5000 美元的 Token 算力,這是一種極大的浪費;他們應該消耗高達 25 萬美元的算力。「算力 ROI」將成為企業最重要的營運指標,企業購買算力不再是「IT 基礎設施支出」,而是「放大頂尖大腦產能的槓桿工具」。就像頂級運動員花費百萬美元保養身體,未來的知識型工作者將配備龐大的 Agent 團隊。這意味著,未來企業的強大與否,取決於他們能否建立一套文化與流程,讓員工毫無阻力地揮霍算力來加速創新。
很多人也質疑各大雲端廠(AWS、Google)都在自研晶片,NVIDIA 的優勢能否維持?黃仁勳透過收購 Groq 以及推動 Dynamo 作業系統給出了答案。AI 運算已經從單純的「矩陣運算」變成包含記憶體讀取、工具調用、邏輯推理的「異質運算網路」。單一的自研 ASIC 晶片很難應付這種複雜度。NVIDIA 賣的不再是單張顯示卡,而是整合了 GPU、CPU、網路架構與特定推理晶片,並由 CUDA 生態系緊密縫合的「整合輸出」。這種系統級別的複雜度,正是對手最難以複製的護城河。
支持TN科技筆記,與科技共同前行
我是TN科技筆記,如果喜歡這篇文章,歡迎留言、點選愛心、轉發給我支持鼓勵~~~也歡迎每個月請我喝杯咖啡,鼓勵我撰寫更多科技文章,一起跟著科技浪潮前進!!>>>>> 請我喝一杯咖啡
在此也感謝每個月持續請我喝杯咖啡的讀者以及新加入的讀者們,讓我更加有動力為各位帶來科技新知!
以下是我的 threads 也歡迎追蹤、回覆、轉發喔!
>>>>> TN科技筆記(TechNotes)























