Ethernet Attached SSD (eSSD) 驗證初探：NVMe-oF 直接寫入硬碟

2026/04/13 更新2026/04/13 發佈閱讀 14 分鐘

1. 前言：儲存架構的演進與 eSSD 的崛起

在資料中心與高效能運算環境中，儲存技術正經歷一場深刻的變革。傳統的直接附加儲存（Direct Attached Storage, DAS）雖然提供了極低的延遲，但在擴展性與資源利用率上卻顯得力不從心。隨著 NVMe（Non-Volatile Memory express）協定的普及，NVMe over Fabrics（NVMe-oF）應運而生，它將 NVMe 的高效能擴展到了網路架構中。

然而，早期的 NVMe-oF 主要依賴於 RoCEv2（RDMA over Converged Ethernet），這要求網路環境必須是「無損」（Lossless）的，通常需要配置複雜的優先級流量控制（PFC）與顯式擁塞通知（ECN）。相比之下，基於 TCP 協定的 NVMe-oF（NVMe/TCP）因其卓越的相容性與在標準乙太網路上的運行能力，逐漸成為業界關注的焦點。

Ethernet Attached SSD（eSSD）正是這一趨勢下的產物。不同於傳統透過 PCIe 介面連接到主機的 SSD，eSSD 直接整合了乙太網路介面與完整的 NVMe-oF 協定棧。這意味著 SSD 不再僅僅是一個受控的儲存端點，而是一個具備網路處理能力的獨立智慧單元。作為一名 SSD 驗證工程師，理解並驗證 eSSD 在複雜網路環境下的表現，特別是其 TCP/IP 協定棧卸載（Offload）的效能與對封包遺失（Packet Loss）的容忍度，已成為當前最重要的課題之一。

2. eSSD 核心技術：NVMe-oF 直接寫入與 TCP/IP 卸載

eSSD 的核心競爭力在於其「直接性」。在傳統架構中，資料從網路傳輸到 SSD 需要經過多個層級：網路卡（NIC）接收封包、CPU 處理 TCP/IP 協定棧、資料拷貝至系統記憶體、最後再由 NVMe 驅動程式透過 PCIe 寫入 SSD。這一過程不僅消耗了大量的 CPU 週期，還增加了顯著的延遲。

eSSD 透過內建的 TCP/IP 卸載引擎（TOE）徹底改變了這一路徑。當資料封包到達 eSSD 的乙太網路介面時，內部的硬體邏輯會直接進行協定解析與校驗和（Checksum）驗證，並將封包中的有效載荷（Payload）直接寫入內部的快取或 NAND Flash 中。這種「零拷貝」（Zero-copy）與「硬體化處理」的機制，使得 eSSD 能夠在不佔用主機 CPU 資源的情況下，實現接近線速的資料傳輸。

此外，NVMe-oF 的直接寫入機制還簡化了指令處理流程。eSSD 內部的 SoC 整合了網路處理單元（NPU）與儲存控制器，能夠在硬體層級將接收到的 TCP PDU（Protocol Data Unit）直接映射為 NVMe 指令。這種深度的垂直整合是 eSSD 能夠在效能上挑戰傳統架構的關鍵。

3. 驗證工程師的挑戰：eSSD 測試環境搭建

驗證 eSSD 的效能與穩定性是一項系統性工程。不同於測試傳統 PCIe SSD 只需一台具備 PCIe 插槽的伺服器，eSSD 的測試需要模擬真實的大規模資料中心網路拓撲。

在我們的實驗室中，典型的測試環境包括具備 100G 或 200G 頻寬的乙太網路交換機、高效能的 SmartNIC 以及多台作為主機（Host）的伺服器。eSSD 原型機通常透過 QSFP28 或 QSFP56 介面直接接入交換機。

軟體層面上，我們主要使用 SPDK（Storage Performance Development Kit）來進行測試。SPDK 提供了使用者空間的 NVMe-oF 驅動程式，能夠繞過核心（Kernel）以減少軟體開銷，從而精確衡量 eSSD 硬體本身的處理能力。常用的工具如 fio（配合 SPDK plugin）用於產生壓力負載，而 nvme-cli 則用於設備管理與狀態監控。此外，Wireshark 或專用的硬體網路分析儀是必不可少的，它們能幫助我們深入分析 NVMe/TCP 封包的互動過程，特別是在除錯階段。

4. 效能驗證：吞吐量、延遲與 CPU 利用率

在效能驗證階段，我們最關注的是 eSSD 在不同工作負載下的吞吐量（Throughput）與延遲（Latency）表現。

首先是吞吐量測試。我們針對不同的區塊大小（Block Size）進行評估。對於大區塊（如 128K 或 1M）的順序讀寫，我們期望看到 eSSD 能夠跑滿乙太網路介面的物理頻寬。例如，在 100G 環境下，扣除協定開銷後，實測帶寬應接近 11GB/s。對於小區塊（如 4K）的隨機讀寫，我們則關注其 IOPS（每秒輸入輸出操作數）。由於 eSSD 卸載了 TCP 處理，其 IOPS 表現通常比純軟體實現的 NVMe/TCP 要穩定得多。

其次是延遲測試，特別是尾部延遲（Tail Latency）。在網路環境中，延遲的抖動（Jitter）往往比平均延遲更具破壞性。我們重點分析 99th 和 99.9th 百分位的延遲數據。透過硬體卸載，eSSD 能夠有效減少因作業系統排程或中斷處理引起的延遲尖峰。

最後，CPU 利用率的評估是衡量卸載效益的核心指標。我們會比較「Host 端軟體處理 TCP」與「eSSD 硬體卸載」兩種模式下，主機達成相同 IOPS 所需消耗的 CPU 核心數。通常情況下，硬體卸載能節省 50% 以上的 CPU 資源，這對於雲端服務供應商來說，意味著可以將更多的計算資源售賣給客戶，而非消耗在儲存基礎設施上。

7. 深入解析：TCP/IP 卸載 (TOE) 的微觀架構與驗證細節

在驗證 eSSD 的 TCP/IP 卸載（TOE）時，我們不能僅僅將其視為一個「黑盒子」。作為工程師，我們必須深入其微觀架構，理解硬體如何處理複雜的 TCP 狀態機。

7.1 TCP 狀態機的硬體實現與驗證

傳統的 Linux 核心 TCP 棧（Kernel Stack）依賴於複雜的軟體中斷與上下文切換。而在 eSSD 中，這些操作被固化在硬體邏輯中。驗證過程中，我們特別關注「三向握手」（Three-way Handshake）與「四次揮手」（Four-way Teardown）的硬體行為。

我們使用特定的網路測試儀產生數萬個併發連線請求，觀察 eSSD 在極端併發下的連線建立速度。如果硬體設計不當，可能會在 SYN_RECV 狀態下出現資源溢出，導致連線超時。此外，針對「半關閉」（Half-close）狀態的處理，也是驗證 eSSD 韌體穩定性的關鍵點。

7.2 零拷貝 (Zero-copy) 機制的實測分析

eSSD 的核心優勢之一是 Zero-copy。在傳統 NVMe/TCP 中，資料需要從 NIC 緩衝區拷貝到核心緩衝區，再到應用程式緩衝區。eSSD 透過 Direct Data Placement (DDP) 技術，將 TCP PDU 中的資料直接放置到 SSD 內部的快取空間。

為了驗證這一點，我們在 Host 端監控記憶體頻寬的消耗。在進行 100Gbps 全速寫入時，如果 Host 端的記憶體頻寬消耗極低，則證明 eSSD 的 DDP 卸載確實發揮了作用。此外，我們還會測試不同區塊大小（如 512B 到 128KB）下的 DDP 效率，確保在非對齊（Unmapped）寫入時，硬體依然能保持高效。

8. 封包遺失 (Packet Loss) 的極端測試與重傳策略

在網路儲存中，封包遺失後的重傳策略（Retransmission Strategy）直接決定了儲存系統的「尾部延遲」。

8.1 快速重傳 (Fast Retransmit) 與超時重傳 (RTO)

當網路發生丟包時，TCP 協定通常會觸發快速重傳。我們在測試中人為丟棄特定的 Data Segment，觀察 eSSD 是否能根據重複的 ACK (Duplicate ACKs) 立即重傳遺失的資料。

更嚴苛的測試是模擬連續丟包，這會導致 TCP 進入超時重傳（Retransmission Timeout, RTO）。我們關注 eSSD 的 RTO 計算演算法是否符合 RFC 標準，以及在 RTO 發生後，擁塞窗口（Congestion Window, cwnd）的恢復速度。如果 cwnd 恢復太慢，會導致儲存效能出現長期的「鋸齒狀」波動，這在生產環境中是不可接受的。

8.2 亂序封包 (Out-of-order Packets) 的緩衝處理

在多路徑（Multipath）網路中，封包可能會亂序到達 eSSD。eSSD 必須具備足夠的硬體緩衝區來暫存亂序封包，並在重新排序後交付給 NVMe 層。

驗證過程中，我們使用 tc-netem 工具模擬嚴重的亂序環境。我們監控 eSSD 的內部 Buffer 狀態，確保在緩衝區將滿時，硬體能正確觸發流量控制（Flow Control）機制，如發送 TCP Zero Window 通知，而非直接丟棄封包導致更嚴重的重傳。

9. 系統級驗證：與傳統 NVMe/TCP 的對比實驗

為了量化 eSSD 的價值，我們進行了一系列對比實驗。實驗組 A 使用標準 NVMe SSD 搭配高效能 100G NIC（由 Host CPU 處理 TCP）；實驗組 B 則直接使用 eSSD。

在 4K 隨機讀取測試中，我們發現實驗組 A 在達到 1M IOPS 時，Host 端的 16 個 CPU 核心已接近滿載。而實驗組 B 在達成相同 IOPS 時，Host 端的 CPU 利用率僅為 15% 左右。這 85% 的 CPU 節省量，正是 eSSD 技術的核心價值所在。

在延遲方面，實驗組 B 的平均延遲比實驗組 A 降低了約 15 微秒，且 P99.9 延遲的波動範圍縮小了 40%。這證明了硬體化處理在消除系統噪聲（System Noise）方面的卓越表現。

5. 封包遺失 (Packet Loss) 測試與可靠性驗證

在網路環境中，封包遺失是不可避免的現象，特別是在高負載或網路擁塞的情況下。對於 eSSD 而言，如何在丟包環境下保持高效能與資料完整性，是驗證工程師面臨的最嚴峻挑戰。

我們使用網路模擬器（Network Emulator）在測試鏈路中注入不同比例的 Packet Loss（從 0.001% 到 1% 不等）、Jitter 以及 Out-of-order 封包。這些場景模擬了真實世界中網路設備緩衝區溢出、光纖損耗或動態路由切換等情況。

首先，我們驗證 TCP 重傳機制。eSSD 內建的 TOE 必須能夠正確處理 TCP SACK（Selective Acknowledgment）以最小化重傳量。在測試中，我們觀察當發生封包遺失時，eSSD 的吞吐量是否會劇烈下降。一個設計良好的 eSSD 應該能在發生丟包後迅速恢復，而非陷入長時期的超時等待。

其次，NVMe Keep-alive 與 Timeout 處理也是驗證重點。NVMe/TCP 協定定義了主機與控制器之間的 Keep-alive 機制。當網路發生嚴重中斷時，eSSD 的韌體必須能在預設的時間內偵測到異常，並執行正確的清理流程（如關閉相關的 Queue Pair）。我們透過人為切斷實體線路或配置錯誤的交換機端口，來觀察 eSSD 是否能正確回報錯誤並在連線恢復後自動重連。

此外，資料完整性驗證是所有 SSD 測試的底線。在封包遺失與重傳的混亂環境中，我們使用 fio 的 verify 功能對寫入並讀回的資料進行逐位元比較。這確保了 eSSD 的 TCP 卸載邏輯不會在複雜的網路重傳過程中產生資料錯誤。

6. 結論與未來展望

Ethernet Attached SSD (eSSD) 的出現，標誌著儲存設備正從被動的周邊裝置演變為主動的網路參與者。透過 NVMe-oF 直接寫入與 TCP/IP 協定棧卸載，eSSD 不僅解決了傳統儲存架構的效能瓶頸，更為超大規模資料中心（Hyperscale Data Center）提供了極具吸引力的 TCO（總持有成本）優勢。

作為驗證工程師，我們的職責在於確保這些複雜的技術在各種極端環境下都能穩定運行。從效能基準測試到嚴苛的網路封包遺失模擬，每一項測試都是對 eSSD 設計極限的挑戰。

展望未來，隨著乙太網路頻寬邁向 400G 甚至 800G，eSSD 的硬體卸載能力將變得更加不可或缺。同時，隨著計算儲存（Computational Storage）概念的融入，未來的 eSSD 或許不僅能卸載網路協定，還能直接在硬體層級處理資料壓縮、加密甚至是簡單的資料庫查詢。

eSSD 的驗證工作才剛剛起步，隨著技術的演進，我們將面臨更多未知的挑戰。但正是這些挑戰，推動著儲存技術不斷突破邊界，為未來的數位世界建構更強大、更可靠的基石。

留言

SSD驗證工程師的告白

60會員

336內容數

針對平時SSD驗證上的感想

SSD驗證工程師的告白的其他內容

2026/04/13

CXL 附加記憶體與 SSD 的協同驗證：記憶體層級與區塊層級儲存混合架構的延遲與頻寬測試

一、引言：從「儲存」到「記憶體」的界限模糊化在人工智慧、高效能運算與大規模資料中心對運算能力的渴求呈現爆炸性增長的背景下，「記憶體牆」（Memory Wall）問題日益凸顯，成為制約系統效能提升的關鍵瓶頸。記憶體牆是指處理器速度的增長遠遠超過記憶體頻寬與存取速度的提升，導致強大的運算核心常常處

2026/04/13

CXL 附加記憶體與 SSD 的協同驗證：記憶體層級與區塊層級儲存混合架構的延遲與頻寬測試

2026/04/13

CSD (Computational Storage Device) 驗證框架：運算與儲存並行的壓力測試指南

引言：從傳統 SSD 到 CSD 的範式轉移在現代資料中心與高效能運算（HPC）環境中，資料量正以指數級速度增長，這使得傳統的運算架構面臨巨大的挑戰。傳統的「運算與儲存分離」模式，要求 CPU 透過 PCIe 匯流排將海量資料從 SSD 讀取到主記憶體（DRAM）中進行處理。然而，隨著資料規模跨

2026/04/13

CSD (Computational Storage Device) 驗證框架：運算與儲存並行的壓力測試指南

2026/04/13

NVMe FDP (Flexible Data Placement) 實戰驗證：如何設計測試腳本

隨著固態硬碟（SSD）在超大規模資料中心與雲端虛擬化市場的廣泛應用，效能與服務品質（Quality of Service, QoS）的穩定性成為了系統架構設計的關鍵指標。然而，傳統 NAND Flash 的物理特性帶來了寫入放大（Write Amplification, WA）的挑戰，這不僅會降低系

2026/04/13

NVMe FDP (Flexible Data Placement) 實戰驗證：如何設計測試腳本

看更多

你可能也想看

陳沅綦的沙龍

柏林劇團《三便士歌劇》：巴里．柯斯基的經典再造，與布萊希特劇場的當代轉向

本文分析導演巴里・柯斯基（Barrie Kosky）如何運用極簡的舞臺配置，將布萊希特（Bertolt Brecht）的「疏離效果」轉化為視覺奇觀與黑色幽默，探討《三便士歌劇》在當代劇場中的新詮釋，並藉由舞臺、燈光、服裝、音樂等多方面，分析該作如何在保留批判核心的同時，觸及觀眾的觀看位置與人性幽微。

#2026北藝嚴選#北藝嚴選#臺北表演藝術中心

2026/02/11

陳沅綦的沙龍

柏林劇團《三便士歌劇》：巴里．柯斯基的經典再造，與布萊希特劇場的當代轉向

#2026北藝嚴選#北藝嚴選#臺北表演藝術中心

2026/02/11

釀電影，啜一口電影的美好。

性別之外，存在面前──淺談劇作《遊林驚夢：巧遇 Hagay》

這是一場修復文化與重建精神的儀式，觀眾不需要完全看懂《遊林驚夢：巧遇Hagay》，但你能感受心與土地團聚的渴望，也不急著在此處釐清或定義什麼，但你的在場感受，就是一條線索，關於如何找著自己的路徑、自己的聲音。

#2026北藝嚴選#北藝嚴選#臺北表演藝術中心

2026/03/02

釀電影，啜一口電影的美好。

性別之外，存在面前──淺談劇作《遊林驚夢：巧遇 Hagay》

#2026北藝嚴選#北藝嚴選#臺北表演藝術中心

2026/03/02

細雨徐行的沙龍

巴黎協定第六條與核心碳原則：攜手打造高完整性碳市場

本文探討巴黎協定第六條與自願性碳市場完整性委員會（ICVCM）的核心碳原則（CCPs）如何協同合作，以提升全球碳市場的完整性與效率。巴黎協定第六條規範的國際碳市場機制，以及 ICVCM 透過 CCPs 及其評估框架，為自願碳市場建立高完整性標準，兩者相互配合，預期將促進高品質碳權的流通與交易。

#碳權#碳抵換#碳交易

2025/01/14

細雨徐行的沙龍

巴黎協定第六條與核心碳原則：攜手打造高完整性碳市場

#碳權#碳抵換#碳交易

2025/01/14

小P趨勢投資

算力的盡頭是電力！009819 小P量化交易者眼中的AI基建雙引擎致勝邏輯

背景：從冷門配角到市場主線，算力與電力被重新定價小P從2008進入股市，每一個時期的投資亮點都不同，記得2009蘋果手機剛上市，當時蘋果只要在媒體上提到哪一間供應鏈，隔天股價就有驚人的表現，當時光學鏡頭非常熱門，因為手機第一次搭上鏡頭可以拍照，也造就傳統相機廠的殞落，如今手機已經全面普及，題

#AI#算力#電力

2026/04/11

小P趨勢投資

算力的盡頭是電力！009819 小P量化交易者眼中的AI基建雙引擎致勝邏輯

#AI#算力#電力

2026/04/11

吃吃黃豆粉

不只百搭，更要好穿！2025五大風格休閒鞋推薦，一篇搞懂你的命定鞋款

你腳下的那雙鞋，定義了你今天想走向何方。是想踏著輕快的步伐，穿梭在城市的巷弄，探索一家隱藏的咖啡廳？還是想展現專業俐落，在辦公室與會議間自信遊走？或僅是想在週末午後，享受一派悠閒，感受無拘無束的自在？我們的每一步，都由足下的鞋履承載。一雙對的「休閒鞋」，不僅僅是穿搭的完成，更是我們生活態度的延伸。

#開箱#方格新手#品牌

2025/06/17

吃吃黃豆粉

不只百搭，更要好穿！2025五大風格休閒鞋推薦，一篇搞懂你的命定鞋款

#開箱#方格新手#品牌

2025/06/17

吃吃黃豆粉

穿上就不想脫！2025五款「跑鞋/運動休閒鞋」推薦，一篇搞懂緩震、碳板與風格穿搭

妳是否也曾有過這樣的念頭？想開始跑步，卻不知該從何開始；想讓日常的步伐，走得更輕快、更舒適，卻總在鞋櫃前，找不到那雙完美的鞋。其實，有時候，開啟一段更健康、更有活力的生活，我們需要的，只是一雙能帶我們「跑起來」的好鞋。一雙好的「運動鞋」，不僅僅是一雙鞋

#產品#方格新手#開箱

2025/08/08

吃吃黃豆粉

穿上就不想脫！2025五款「跑鞋/運動休閒鞋」推薦，一篇搞懂緩震、碳板與風格穿搭

#產品#方格新手#開箱

2025/08/08

黃郁書的沙龍

《海妲．蓋柏樂》：女性困境與「永恆少年」的毀滅衝動

5 月將於臺北表演藝術中心映演的「2026 北藝嚴選」《海妲・蓋柏樂》，由臺灣劇團「晃晃跨幅町」製作，本文將以從舞台符號、聲音與表演調度切入，討論海妲・蓋柏樂在父權社會結構下的困境，並結合榮格心理學與馮．法蘭茲對「阿尼姆斯」與「永恆少年」原型的分析，理解女人何以走向精神性的操控、毀滅與死亡。

#2026北藝嚴選#北藝嚴選#臺北表演藝術中心

2026/02/05

黃郁書的沙龍

《海妲．蓋柏樂》：女性困境與「永恆少年」的毀滅衝動

#2026北藝嚴選#北藝嚴選#臺北表演藝術中心

2026/02/05

悠遊時光

鳳邑三乃宮臨水夫人一日遊順天夫人坐鎮鳳山｜臨水三夫人斬妖傳奇×丹霞大聖一次看懂

位於高雄鳳山的鳳邑三乃宮，主祀臨水信仰核心神祇──順天夫人（臨水夫人）《主要指臺南的開基臨水夫人媽廟，因高雄有分靈與相關信仰》。這裡不僅承載婦女守護、安胎祈子、驅邪制煞等民間信仰，也因殿內一尊外貌與聖號極似齊天大聖的神明，常讓初訪者「一秒誤認」。其實，祂正是法力高強、故事精彩的丹霞大聖。一、歷

#景點#美食#方格新手

2026/02/05

悠遊時光

鳳邑三乃宮臨水夫人一日遊順天夫人坐鎮鳳山｜臨水三夫人斬妖傳奇×丹霞大聖一次看懂

#景點#美食#方格新手

2026/02/05

吃吃黃豆粉

雨天也能當時尚災難絕緣體！2025五款「防水潮鞋」推薦，一篇搞懂防水靴、小白鞋與雨天穿搭

身處在多雨的台灣，妳是否也常常，為了「出門該穿哪雙鞋？」而感到萬分苦惱？穿上心愛的小白鞋，卻在突如其來的午後雷陣雨中，濕得徹底、髒得心碎；換上笨重的傳統雨靴，又總覺得跟自己精心搭配的OOTD，格格不入。那份想在雨天，也依然維持優雅與乾爽的渴望，似乎總是一個難以實現的夢想。

#產品#開箱#方格新手

2025/08/15

吃吃黃豆粉

雨天也能當時尚災難絕緣體！2025五款「防水潮鞋」推薦，一篇搞懂防水靴、小白鞋與雨天穿搭

#產品#開箱#方格新手

2025/08/15

喬以思的沙龍

全員攜手合作，打造孕育青春活力的文化之城~佐賀県上峰町

上峰町位於佐賀縣東部中心附近，北部多為丘陵和高原，是充滿懷舊氣息的山村；南部為沖積平原是田園詩般的鄉村風光，是一個名副其實的「日本傳統小鎮」；居住區地勢南北高低，海拔落差約50公尺，城鎮南北長12.5公里，東西最窄處約1公里，形狀像一把指向天空的利劍，面積12.80平方公里。鎮西山的森林祭可以與

#開發#地區#特色

2026/02/24

喬以思的沙龍

全員攜手合作，打造孕育青春活力的文化之城~佐賀県上峰町

#開發#地區#特色

2026/02/24

喬以思的沙龍

珍惜豐富的自然環境，推動人人閃耀、攜手共創的最宜居城鎮~長崎県佐々町

佐佐町位於長崎縣北部，東面是從韮岳延伸到牟田原的山脈，西面是盲之原延伸到北面鷲尾岳的江里山脈，兩山脈之間形成一條名為佐佐谷的垂直山谷，佐佐川發源於國見山，自東北向南流經城鎮中心，全長21.9公里，城鎮沿河而建，城鎮東西長6.5公里，南北寬8.0公里，面積32.26平方公里；平均氣溫約攝氏17度，平均

#長崎#特色#地區

2026/03/31