黃仁勳如何用一個虧本的決定,建起AI時代最深的護城河
英偉達(Nvidia)現在是全球市值最高的公司之一,但在某個時刻,它的市值只剩下15億美元。黃仁勳在與 Lex Fridman 長達兩個多小時的對話裡,回顧了那段幾乎葬送公司的決定,解釋了他如何看待技術演進、如何建立組織,以及為什麼他認為AGI已經到來。這場對話橫跨工程哲學、領導學、地緣政治,乃至對死亡的態度,是一位處於歷史轉折點的工程師的完整自白。
一、系統的邊界,才是真正的問題所在
問題不再放得進一台電腦裡——這是黃仁勳對當前AI基礎設施挑戰最精簡的描述。
英偉達的轉型,從晶片公司到他所稱的「極端協同設計」(extreme co-design),根源在一個工程學上的基本困境:當你把一萬台電腦連結在一起,你希望運算速度提升一百萬倍,但這幾乎是不可能的。問題在阿姆達爾定律(Amdahl’s Law):如果運算只佔整體工作負載的50%,即使你讓運算速度提升無限倍,整體效率也只加倍。瓶頸永遠會轉移到其他地方——網路、記憶體、儲存、散熱、電力。
這正是為什麼英偉達現在設計的不是一個GPU,而是整個機架(rack)。從GPU、CPU、記憶體、網路晶片、交換器、電源、冷卻系統、系統軟體,到機架本身的物理結構,全部必須同時協同優化。黃仁勳把這稱為公司存在的奇蹟:「我們在對整個軟硬體堆疊做極端協同設計。」
這種哲學直接反映在公司組織架構上。黃仁勳有60位直接匯報者,幾乎全部有工程背景,涵蓋記憶體、CPU、光學、GPU、演算法等各個專業。他不做一對一會議——不是因為沒時間,而是因為問題本質上不允許。「我們提出一個問題,然後所有人一起攻擊它。因為我們在做極端協同設計,整間公司隨時都在做極端協同設計。」一個討論散熱的會議,記憶體專家和網路專家都必須在場,因為散熱的解法可能影響記憶體頻寬,記憶體的佈局可能改變電力分配。
二、CUDA:一個差點讓公司倒閉的賭注
英偉達的護城河不是技術,而是安裝基數(installed base)。這句話在對話中反覆出現,而理解它需要回到一個幾乎葬送公司的決定。
2006年前後,英偉達發明了CUDA——一個讓GPU可以執行通用運算的程式架構。問題是:一個新的計算平台要吸引開發者,需要龐大的裝機量;但要建立裝機量,你必須先把它放進每一台機器裡。黃仁勳的決定是:把CUDA放進GeForce——消費者遊戲顯卡。
這個決定在財務上是毀滅性的。CUDA大幅增加了每張GeForce顯卡的製造成本,但玩家只會付他們願意付的價格。英偉達的毛利率是35%,成本卻上升了50%。公司市值從大約80億美元跌到15億美元,在那個低谷待了相當一段時間。
為什麼還要做?黃仁勳的邏輯是:計算平台的勝負從來不是純技術決定的。他舉x86為例——從純粹的工程美學來看,x86是個劣架構,遠不如許多RISC設計優雅,但它活下來了,因為它的裝機量無人能及。「安裝基數就是一切。」所以英偉達選擇用GeForce建立CUDA的裝機量,用遊戲玩家的市場補貼一個科學計算平台的普及。他們還主動跑去大學開課、寫書、教CUDA,讓每個研究生實驗室都能用一台GeForce跑超級電腦等級的運算。
那些研究生後來成了深度學習革命的主力。他們在宿舍用GeForce跑神經網路,就這樣——CUDA成了深度學習的基礎設施,而英偉達變成了今天的英偉達。「是GeForce建起了這棟房子,」黃仁勳說,「因為是GeForce把CUDA帶到了所有人手裡。」
時至今日,CUDA版本已到13.2,有數百萬開發者在其上構建了龐大的軟體生態。這就是黃仁勳所說的護城河:不是晶片性能,而是那數百萬人的決定——他們選擇在這個平台上押注自己的時間和事業。
三、四個擴展定律,以及下一個
AI的能力邊界不斷被宣告到來,然後不斷被突破。黃仁勳把這個過程拆解為四個擴展定律(scaling laws)。
第一個是預訓練(pre-training):模型越大、數據越多,AI越聰明。當Ilya Sutskever宣稱「我們的數據要耗盡了」時,業界一度以為AI到了極限。但黃仁勳的回應是:人類傳遞的知識本來就是「合成的」——它不是從自然界直接提取的,而是人創造、消費、修改、再生成的。AI現在可以做同樣的事,用基礎真實數據生成大量合成訓練數據,訓練的瓶頸從數據量轉移到了算力。
第二個是後訓練(post-training):微調、對齊、強化學習。這一層繼續在擴展。
第三個是測試時擴展(test-time scaling),也是黃仁勳最想糾正外界誤解的部分。長期以來,業界有一種觀點:訓練是重活,推理(inference)是輕活,所以推理晶片會走向小型化和商品化。黃仁勳認為這從一開始就是邏輯錯誤。「推理就是思考。思考遠比閱讀難。預訓練是記憶和歸納,你在讀書;推理是思考、規劃、搜尋、分解問題。」測試時間的擴展同樣極度運算密集。
第四個是代理人擴展(agentic scaling):一個AI代理人在運行時,會衍生出更多子代理人,形成一個AI團隊。這些代理人執行任務、產生新數據,其中優質的部分可以循環回到預訓練,強化整個模型。黃仁勳把這個循環描述為自我強化的飛輪:「到最後,智慧的擴展只取決於一件事:算力。」
面對AI模型架構每六個月更新一次、但硬體架構需要三年才能迭代的時差,英偉達的應對方式是:自己做AI研究(Neatron模型)、廣泛聆聽業界動態,以及保持架構的靈活性。當Mixture of Experts(混合專家模型)出現時,英偉達及時推出了NVLink 72,讓72個GPU可以高速互連——不是因為預見到了這個架構,而是因為他們夠靈活。
四、領導的本質是塑造信念
黃仁勳描述了一種特殊的領導方式:他不做大型宣告,不做突然的組織變革。他做的事,是每天逐步塑造周圍所有人的信念系統。
「當我發現某件事開始影響我的思考,我會立刻讓身邊所有人知道:這件事很有意思,這將會有所不同,這將衝擊那個領域。」他在董事會、管理團隊、員工之間不斷重複這個過程。到他宣布「我們要全力押注深度學習」的那一天,大多數人早已在無數次對話中吸收了這個邏輯的各個部分。「我希望在宣布的那一天,員工心裡說的是:Jensen,你怎麼這麼慢才決定?」
對供應鏈夥伴,他用同樣的方式建立信任。他親自飛到工廠,用第一原理向合作夥伴解釋接下來會發生什麼、為什麼這是必要的,然後請他們做出數十億美元的資本投資。「等我講完,他們只知道該怎麼做,沒有為什麼的問題。」
他也高度讚揚了Elon Musk在四個月內用20萬張GPU建起Colossus超算的能力。黃仁勳的分析是:Musk的核心能力是系統思考與極端精簡——他不斷追問「這真的必要嗎?」「一定要這樣做嗎?」直到系統被削減到最低必要複雜度。加上他親身現場處理問題,讓自己成為所有供應商的首要優先項目。
在談到AGI時,黃仁勳的立場是直接的:「我認為現在已經達到了AGI。」他的定義基於能力而非形式——一個AI系統能否建立一個觸及十億用戶的網路服務,哪怕只運作一段時間?他認為完全可以。他同時承認,AI能夠理解和辨識人類的情緒,但不會親身感受它們;晶片不會緊張,而人類的焦慮和興奮是驅動人類表現的關鍵變數,這是目前AI與人類之間最根本的差異。
認識框架
黃仁勳的認識論框架,可以用一個動作來描述:從問題的邊界往回推導。他不從技術可能性出發,而是從問題的本質和規模出發,問「這件事的瓶頸到底在哪裡」,然後讓答案告訴他下一步應該去哪裡。這個框架讓他在別人恐慌的時候保持冷靜——當業界說預訓練的數據要耗盡,他的反應不是跟著恐慌,而是問:為什麼我們認定訓練數據只能來自自然世界?當業界說推理晶片會走向商品化,他的反應是:推理是思考,思考從來不便宜。他對世界的認識,有一種一致的結構:任何被廣泛接受的悲觀論斷,都值得重新追問它的前提假設是否成立。他相信技術演進是可以被推理出來的,而不只是被預測的——推理和預測的差別在於,推理可以被驗證、被修正,而預測只是賭注。他把自己的每一個商業決定,都建立在這種可被推翻的推理鏈上,不是信念,而是論證。這也使他在面對CUDA帶來的財務災難時,能夠承受而不是逃跑,因為他相信的不是感覺,而是一個邏輯結論。
選擇建議
黃仁勳認為,正確的行動路徑是:先把邏輯鏈建立清楚,然後長期、持續地把這個邏輯傳遞給所有需要一起行動的人,最後在時機成熟時宣告決定——而那個決定在所有人眼中應該早已是顯而易見的結論。他明確反對「突然宣告式」的領導——那種年初突然宣布新使命、大規模組織重整、新Logo的方式。他的做法是每天在不同的對話中,逐步植入他的推理,讓董事會、管理層、員工、供應鏈夥伴都在這個過程中自然形成共識,等到正式宣布的那一天,阻力已經被提前消化。他認為這才是真正的領導——不是讓人跟著你走,而是讓人覺得這條路是他們自己想通的。在系統設計上,他的主張是:「盡可能簡單,但不能比必要更簡單。」所有的複雜度都需要被測試和挑戰,沒有通過挑戰的複雜度是多餘的。他也主張開源:如果你有能力建立世界級的模型,那麼讓AI擴散到所有行業、所有國家、所有研究者手裡,對整個生態系的長期健康是必要的,封閉只會讓你身處其中的生態縮小。
立刻行動
從這場對話中,有一個可以立刻實踐的思考習慣:當你面對任何讓你感到無力的問題,先問它的瓶頸在哪裡,而不是問它的解法是什麼。找到瓶頸,才能知道你的力量應該放在哪裡,哪些部分你根本不需要管。這是黃仁勳面對分散式運算、面對CUDA決策、面對AI擴展定律時,反覆使用的思維動作。其次,開始有意識地累積你自己的「裝機量」:你的知識、你的可信度、你與他人之間的信任關係。這些是你未來可以在上面繼續建造的基礎,而且一旦累積,它們的價值遠大於任何單一的技術能力。第三,如果你想推動任何改變——在工作上、在家庭中、在任何集體行動的場合——不要靠一次宣告,而是從今天開始,在每一次相關的對話中放進你的推理,讓對方逐漸進入你的邏輯框架,等到需要行動的那一天,你需要說服的工作已經完成了大半。
對身處AI時代感到焦慮的人
焦慮通常有一個特定的形狀:你感覺規則在快速改變,你不知道自己的位置在哪裡,你覺得自己剛學會的東西可能已經過時,而下一個浪潮你根本來不及準備。黃仁勳這場對話提供的,不是「別擔心,AI會幫助你」這種空洞的安慰,而是一個具體的認知校正:即使是英偉達,也不是靠預測對了未來而成功的。CUDA的押注花了十年才兌現,中間市值跌掉80%。黃仁勳自己說,中間有很多苦難,但你必須相信你相信的東西——而那個「相信」不是盲目的,而是建立在你願意一直去推理、去修正的過程上。
對焦慮的人而言,最直接可用的框架是:停止試圖掌握所有技術,開始問「我這個領域真正的瓶頸是什麼」。就像黃仁勳說分散式運算的瓶頸不在計算而在網路,你所在領域的限制可能也不在你以為的地方。找到真正的限制,你就能判斷自己的時間和精力應該放在哪裡,哪些焦慮是有效的,哪些只是雜訊。
其次,接受「裝機量」的邏輯作為自我評估的方式。你現在的知識體系、人際關係、被人信任的程度,就是你的裝機量。它不需要是最優雅的,不需要是最新的,但它是你繼續建造的基礎。x86不是最好的架構,但它活下來了,因為夠多的人在它上面建造了夠多的東西。你積累的每一件有用的事,都在增加你自己的裝機量。這不是要你停止學習,而是要你停止因為「學的不是最新的」而否定自己已經積累的一切。
對願意擁抱生活並保持正向的人
黃仁勳式的正向,不是那種「相信自己就能成功」的口號式樂觀,而是一種建立在推理基礎上的長期行動能力。他不說「一切都會好的」,他說「我已經想清楚了,所以這件事一定會發生,中間的苦難是預期中的代價」。這種區別非常關鍵:前者依賴情緒支撐,後者依賴邏輯支撐,而邏輯在壓力下比情緒更耐用。
對願意主動行動的人,黃仁勳提供了一個可以直接借用的行動框架:在你想推動的任何改變上,先花時間建立完整的邏輯鏈,不只是對自己,而是對所有需要一起行動的人。不要依賴一次大型宣告,而是從今天開始,在每一次相關的對話中放進你的推理,讓合作者、家人、同事逐漸進入你的邏輯框架。當你最終需要集體行動的那一天,你所面對的阻力已經在無數次日常對話中被提前消化了。這是黃仁勳說的「讓員工在宣布的那一天說:你怎麼這麼慢才決定」——那個感覺不是偶然的,是刻意製造的。
關於開源的態度,也值得正向的人借鑒:當你的能力和理解積累到一定程度,分享不會削弱你,只會擴大你的影響範圍。英偉達釋出開源模型不是因為不在乎競爭,而是因為他們理解,AI要真正深入所有行業,必須讓所有人都能觸及它、在它上面創造。同樣地,你願意把你所理解的事情說清楚、傳遞出去,不只讓他人受益,也讓你自己身處其中的生態系變得更大、更有活力——而一個更大的生態系,對在其中工作的人,從來都是更好的環境。這是正向行動最值得持守的邏輯。
#AI時代 #黃仁勳 #科技領導力 #人工智慧 #未來趨勢

























