
概述
在 2026 年的 GTC 主題演講中,NVIDIA 執行長黃仁勳(Jensen Huang)展示了公司從晶片供應商轉型為全方位「AI 工廠」(AI Factories)與基礎設施公司的策略願景。核心論點在於運算需求已從單純的數據檢索轉向生成式與推理式 AI,預計到 2027 年市場需求將突破 1 兆美元。NVIDIA 透過新一代 Vera Rubin 平台、與 Groq 的戰略整合,以及開源代理人作業系統 OpenClaw,致力於將每一家軟體公司轉化為「代理人即服務」(Agentic as a Service, AaaS)供應商。同時,NVIDIA 持續擴展其在實體 AI(Physical AI)、機器人技術以及航太運算領域的影響力。財務預測與市場戰略
NVIDIA 的業務結構與市場展望顯示出 AI 基礎設施建設的巨大規模:
- 需求與營收預估: 黃仁勳預計到 2027 年,計算需求將超過 1 兆美元,且實際增長可能遠超此預期。
- 客戶結構: 營收的 60% 來自超大規模雲端服務商(Hyperscalers,如 AWS、Google Cloud、Microsoft Azure),其餘 40% 則分布在區域雲、企業端、機器人與主權 AI 等多元領域。
- 代幣成本與效率: 透過極致的垂直整合,Vera Rubin 平台能以更低的能源消耗產生更多的代幣(Tokens),預計其效率提升能為數據中心帶來 5 倍於以往的營收潛力。
- CPU 業務崛起: NVIDIA 的 CPU 業務(以 Vera CPU 為首)預計將發展成為價值數十億美元的獨立業務部門。
電力轉化為「代幣(Token)工廠經濟學」
- 未來的資料中心將不再是儲存檔案的倉庫,而是專注生產 Token 的 AI 工廠。
- 在實體工廠受限於 1 GW(吉瓦)電力的物理定律下,系統每瓦效能所能產出的 Token 吞吐量,將直接等同於企業明年的營收。
- 全新的分層定價商業模式 : 從吸引用戶的高吞吐量免費層,到每百萬 Token 收費 3 至 6 美元的中高階層,再到要價高達 150 美元的頂級超高速層。黃仁勳直言:「一座 1 GW 工廠攤提 15 年就是 400 億美元,你最好確保放上最好的系統。」
次世代硬體架構:Vera Rubin 與 Groq 整合
NVIDIA 發表了多項突破性硬體,旨在應對推理運算(Inference)的爆發式增長:
- Vera Rubin 平台: 不是一顆晶片的名字,是一整個平台:7 顆晶片、5 個機櫃級系統、1 台超級電腦,總共 130 萬個零組件。NVIDIA 從 Hopper 架構轉向 Blackwell 以及即將推出的 Vera Rubin 平台,並非只是漸進式升級。具備 3.6 Exaflops 的運算能力,採用全液冷設計,每瓦性能(Performance per watt)比上一代 Hopper 提升 35 倍。
- Vera CPU: 專為編排(Orchestration)和代理人工作流設計,具備極高的單線程性能與能源效率,是全球唯一使用 LPDDR5 記憶體的數據中心 CPU。
- Groq LPU 整合: 透過收購與技術授權,NVIDIA 將 Groq 的 LPU(語言處理單元)技術整合至 Vera Rubin 系統中。透過 Dynamo 軟體進行「解構式推理」(Disaggregated Inference),將 Groq 的低延遲代幣生成能力與 NVIDIA 的高吞吐量結合,使推理性能提升達 35 倍。
- 先進連結技術: 第六代 NVLink 系統與共封裝光學(Co-packaged Optics, CPO)技術的應用,大幅提升了大規模叢集的通訊效率與穩定性。
- 未來路線圖: 繼 Rubin 之後,下一代架構名為 Feynman(費曼),將包含新的 GPU、Rosa CPU、LP40 LPU 以及 BlueField-5 DPU。
AI 軟體生態與代理人作業系統
NVIDIA 致力於將 AI 從單純的對話工具提升為能執行任務的「代理人」:
- OpenClaw 與 NemoClaw: OpenClaw 是目前最熱門的開源代理人作業系統,NVIDIA 則推出了企業級安全版本 NemoClaw,提供隱私路由與安全護欄(Guardrails),使企業能安全地部署可存取敏感資訊並執行外部指令的 AI 代理人。
- Nemotron 聯盟: NVIDIA 聯合 Black Forest Labs、Mistral、Perplexity、LangChain 等公司建立聯盟,開發領域特定的 AI 模型,並推動主權 AI(Sovereign AI)的發展。
- AaaS 轉型: 預測未來軟體公司將轉型為代理人服務(AaaS)供應商,工程師將擁有年度「代幣預算」(Token Budgets)以輔助工作。
- DLSS 5 與神經渲染: 利用生成式 AI 結合 3D 圖形結構化數據,實現「神經渲染」(Neural Rendering),大幅提升電腦圖形的擬真度與可控性,使虛擬世界的內容既美觀又具備完美的控制性。。
數據處理與工業 AI 工廠
數據是 AI 的基石,NVIDIA 針對不同類型的數據提供加速解決方案:
- cuDF 與 cuVS: 分別針對結構化數據(如 SQL、Pandas)與非結構化數據(向量存儲)提供加速庫,與 IBM watsonx.data、Dell 及三大公有雲深度整合。
- NVIDIA DSX 平台: 利用 Omniverse 建立 AI 工廠的「數位孿生」(Digital Twin),讓工程師在虛擬環境中進行熱能、電力與網路模擬,優化數據中心的代幣產出效率。
- 太空運算: NVIDIA 正在開發 Vera Rubin Space One 電腦,旨在將數據中心擴展至太空衛星環境,克服真空環境下的散熱與輻射挑戰。
實體 AI 與機器人技術
實體 AI 是 NVIDIA 長期佈局的重點,目前已與全球眾多製造業與汽車業龍頭合作:
- Alpamayo 自動駕駛平台: 標誌著自動駕駛的「ChatGPT 時刻」到來,新增合作夥伴包括比亞迪(BYD)、現代(Hyundai)、日產(Nissan)與吉利(Geely)。
- Groot 機器人模型: 提供通用型機器人基礎模型,現場展示了與迪士尼研究中心合作開發的小型機器人 Olaf,該機器人完全在 Omniverse 模擬環境中學會行走。
- AI RAN(Aerial): 與 Nokia、T-Mobile 合作,將通訊基地台轉型為具備推理能力的 AI 基礎設施,優化波束成形並降低能耗。
(AI協作整理)























