傳統記憶體週期有一套行之有年的自我修正機制:需求萎縮 → 價格下跌 → 廠商減產或推遲擴產 → 庫存去化 → 價格回升 → 新一輪投資。平均週期大約三到四年。這個機制有一個核心前提:供給可以快速調整。
記憶體廠商可以調整晶圓投入量、延後設備採購、轉移產線用途。只要供給有彈性,市場就有自我修復的能力。這次因為AI史無前例的記憶體需求,供給瞬間變成稀缺資源,從最高階的HBM產生供給排擠,使得各層級的記憶體產品皆變成了需求遠大於供給,由記憶體三大原廠最新一期財報的營收以及毛利率可得知,此循環很可能短期內失效了。

Bit Penalty加上快速迭代,學習曲線無法累積
而半導體製程的基本規律:同一個產品做得越久,良率越高、成本越低、供給越穩定。 傳統 DRAM 週期之所以會出現供給過剩,部分原因正是廠商在穩定規格上把學習曲線走完、 成本大幅下降、產能充裕。
每一片去做HBM的晶圓,能生產的「記憶體位元數」遠低於做傳統DDR5。HBM的封裝架構,需要消耗大量晶圓面積在互連和buffer結構上。估計生產1GB的HBM,消耗的晶圓資源大約相當於生產 3GB DDR5,這就是所謂的Bit Penalty。
而且NVIDIA每12-18個月迭代一次的速度大幅延緩學習曲線。每次迭代,三家廠商皆要重新設計die stacking架構、TSV 規格、封裝整合流程等。每一代 HBM的供給都永遠處於學習曲線的前段。良率改善的紅利還沒有兌現,新規格的需求就已經壓進來了。記憶體近期持續呈現「永遠在爬坡、從不到頂」的供給狀態。
HBM引發擠壓效應 + Agentic尚未普及
傳統記憶體週期的特性,是壓力集中在某一個品類,其他品類可以充當緩衝。這次沒有緩衝層。但CSP客戶直接捧著白花花的銀子,要記憶體三大原廠「給你錢,趕快做」。
三大原廠除了把DDR5產能挪用到HBM外,亦直接排擠其他毛利較低的產品產能,使其他專做DDR4、SSD、NAND Flash等相對低階產品的廠商雞犬升天,將排擠成本向下傳導至記憶體全產品線。
更可怕的是,真正的需求尚未完全浮現,截至目前多數企業使用 AI 的方式本質上仍拘泥於一問一答形式。若導入Agentic Workflow,包含Main agent維持長期task context、多個sub-agent並發運行、跨session保留任務狀態——HBM、SSD、HDD 每一層同時被拉滿。

Agent Workflow 示意圖
當然,近期市場持續傳出各大廠持續研究KV Cache壓縮技術(例如Google Turboquant、DeepSeek-V4加強MLA 架構)可以大幅降低記憶體需求。只能說觀察人類科學發展的歷史,效率提升從來不會減少總消耗,只會解鎖更高層次的使用。CPU效率提升沒有讓軟體變簡單,反而讓更複雜的應用成為可能;網路頻寬提升沒有讓流量變小,而是催生了串流影片。更有效率的KV Cache,意味著可以跑更長的context、更多的agent、更複雜的推論鏈——這些都需要更多記憶體,不是更少。
CSP廠商對於記憶體需求前景
目前三大原廠客戶紛紛向其訂定Long-Term Agreement(LTA),這不免讓市場想起2020–2022 年的記憶體LTA形同一張廢紙的情況。但現在的 HBM LTA 在結構上有根本性的不同,差異在於違約成本的本質。CSP買方須預付合約總值10-30%的現金,連同take-or-pay條款一併接受,就是要求CSP把頭都洗下去,一起skin in the game。

重點是,各大CSP廠商都願意簽上述如此嚴苛的新版LTA,願意把幾十億美元的現金壓進沉沒成本裡,足以見到其對未來3-5年AI算力需求的信心。
市場正在轉換記憶體廠商的訂價邏輯
若上述各個結構面差異的論點都成立,那麼市場過往用來衡量記憶體股的定價工具,可能已經過時。傳統上,記憶體股用PB ratio 定價。邏輯是:景氣循環股的盈利波動大、甚至可以轉負,這時候獲利失去參考意義,只有資產帳面值才是可靠的底部錨點。PB ratio 是「我不知道這家公司下個週期能賺多少」而使用的估值工具,傳統上記憶體股PBR 維持在 1–2x 附近才被認為合理,現在 8–12x 的水準已完全脫離這個框架。

但若如上文敘述的多個高速成長因素與產業護城河(合約提供3-5年的收入能見度、HBM技術門檻與迭代速度不變、Agentic Workflow普及後的需求爆發)成立,將使記憶體產業跳脫景氣循環的枷鎖。今年以來記憶體類股火熱的股價,表示市場漸漸地接受Forward PE的訂價方法較為合理。
















