Claude Code 實測：Sonnet 竟比 Haiku 省 44% token——貴的反而更划算

Stan Wu 吳信典

2026/04/17 更新2026/04/17 發佈閱讀 5 分鐘

選 AI 模型的邏輯，大多數人都這樣想：Haiku 的 token 單價是 Sonnet 的三分之一，所以跑同樣的外部 CLI 指令任務（如 uname -a）應該省三倍的錢。這個邏輯聽起來無懈可擊，直到你實際測量數據。

每則訊息都有「隱藏的固定成本」

Claude Code 每次送出訊息，不只帶上你說的那句話，而是把整個 context 打包一起送：

System prompt：Claude Code 的基本指令
System tools：內建工具的定義（bash、file read/write、edit 等）
MCP tools：你連接的外部工具定義
Skills：CLAUDE.md 或 skills 檔案
Messages：實際的對話歷史

前四項是每則訊息的固定成本，不管你說什麼都要帶著走。

實測結果：

Sonnet 4.6 固定成本合計：16.1k tokens
Haiku 4.5 固定成本合計：29.3k tokens

差距的關鍵在 System tools——Haiku 的 system tools 是 Sonnet 的 2.4 倍（22.3k vs 9.4k）。原因是 Claude Code 為理解能力較弱的 Haiku 提供了更詳細的工具說明作為補償，但這對使用者完全不透明。

每發一則訊息，Haiku 比 Sonnet 多帶 13.2k input tokens 的固定負擔。

真實任務下的差距：Sonnet 只用了 Haiku 的 56% 額度

給兩個模型同樣目標——連線遠端主機、執行一系列系統診斷指令：

Sonnet 4.6 總 context 消耗：19.1k tokens
Haiku 4.5 總 context 消耗：34.1k tokens

但更驚人的是兩個模型做事方式完全不同：

Haiku：傾向多執行緒，每個指令獨立一次 SSH：

ssh bm "hostname" &
ssh bm "uname -a" &
ssh bm "df -h" &
ssh bm "free -m" &

每個 tool call 和 output 都進 Messages，累積快，SSH 握手也重複多次。

Sonnet：自發性使用組合指令，單次 SSH 完成多個步驟：

ssh bm "hostname && uname -a && df -h && free -m"

一次 tool call，Messages 增加量少很多，執行也更快。

這不是人為設定的差異——是模型在相同目標下自己選擇的執行策略。Sonnet 的能力直接轉化成更有效率的資源使用。

訂閱制用戶最在意的事

如果你用的是 Claude Pro 或 Max 訂閱制，沒有每個 token 的直接費用，但有 usage 額度限制。

跑同樣任務，Sonnet 只用了 Haiku 的 56% 額度。

這個差距隨任務變長會持續擴大，因為 Haiku 的 Messages 累積速度更快，更早觸發 autocompact（Claude Code 自動壓縮對話歷史的機制）——壓縮本身又需要消耗額外 token，形成複利式疊加。

什麼情況下 Haiku 仍有優勢？

極短的 session（< 5 輪）：固定成本差距來不及累積
純文字任務：不需大量 tool call，system tools 差距影響小
API 計費模式：按 token 付費時，Haiku 單價優勢在特定條件下仍成立

結語

這跟超市買洗碗精是同一個邏輯：49的那瓶看起來便宜，但如果濃度只有一半，每次要擠兩倍的量，89 的才是真的省。問題是，沒有人把「隱藏成本」印在標籤上——Claude Code 為 Haiku 注入的詳細工具說明也一樣，使用者根本看不到。

選模型的正確框架不是「單價比較」，而是「完成同一件任務，哪個選項的總 token 消耗最低」。

在預算相同的前提下，Sonnet 讓你做更多事。

本文所有數據均來自實測，使用 Claude Code /context 指令記錄。
完整實驗數據與三階段對比請見原文：https://blog.stanwu.org/posts/sonnet-vs-haiku-token-cost/*

注意：本實驗僅在 SSH + bash 工具呼叫情境下設計，具有場景局限性，數據僅供參考。

留言

Stan Wu 吳信典

56會員

201內容數

我是 Stan Wu 吳信典。我相信：「我們從程式設計的邏輯世界走來，以為萬物都能被預測與控制，直到遇見 AI，才發現智慧不只是規則的堆疊，而是滲透在無數經驗中的模糊與真實。」我也始終堅信：「簡單，就是極致的美學。」

Stan Wu 吳信典的其他內容

2026/04/16

200 萬封廣告信，換來 6 週業務停擺：從 K 公司事件看 Email 基礎建設

大多數公司把電子郵件當工具，覺得「能收能發就好」。但電子郵件其實更像公司大樓裡埋在牆壁和地板下的管路系統：施工期間看不出好壞，一旦封起來，要改管路就得打牆，代價是原本施工成本的數倍，真實事件：一封廣告信如何讓全公司收不到信。

2026/04/16

200 萬封廣告信，換來 6 週業務停擺：從 K 公司事件看 Email 基礎建設

2026/04/16

AI Agent 時代來了嗎？技術神話、市場敘事與真正的權力轉移

在人工智慧發展的宏大敘事中，「Agentic AI」被普遍視為從輔助工具演進為生產力實體的關鍵躍遷。但當你拆解真實數據與產業部署案例，會發現市場正處於一個真實趨勢與行銷包裝高度混合的迷霧期。

2026/04/16

AI Agent 時代來了嗎？技術神話、市場敘事與真正的權力轉移

2026/04/16

護城河的崩塌：Perplexity 為何從顛覆者變成被包圍者

當初，市場對其高度評價在於一個簡單而強大的承諾：如果大型語言模型會產生「幻覺」，那麼最直觀的對策就是將實時搜尋檢索接入模型架構中。這種「提供有來源的答案」的敘事方式，在當時具有極高的說服力，成功地將 Perplexity 從眾多聊天機器人中區分開來，如今卻被反噬。

2026/04/16

護城河的崩塌：Perplexity 為何從顛覆者變成被包圍者

看更多

你可能也想看

陳沅綦的沙龍

柏林劇團《三便士歌劇》：巴里．柯斯基的經典再造，與布萊希特劇場的當代轉向

本文分析導演巴里・柯斯基（Barrie Kosky）如何運用極簡的舞臺配置，將布萊希特（Bertolt Brecht）的「疏離效果」轉化為視覺奇觀與黑色幽默，探討《三便士歌劇》在當代劇場中的新詮釋，並藉由舞臺、燈光、服裝、音樂等多方面，分析該作如何在保留批判核心的同時，觸及觀眾的觀看位置與人性幽微。

#2026北藝嚴選#北藝嚴選#臺北表演藝術中心

2026/02/11