從文言文到 AST:AI Agent Memory 語義壓縮的可行性分析

更新 發佈閱讀 11 分鐘

古代人刻竹簡、抄手稿,每個字的儲存成本都極高。這個物理限制直接塑造了文言文的語言風格——用最少的字,傳遞最密集的語意。

這不只是文化,是工程決策。

當我開始思考 AI agent 的 memory 管理問題,這個古老的邏輯突然變得非常現代。

文言文是一種有損壓縮格式

從資訊理論的角度看,文言文是一套高壓縮比、高解碼成本的編碼系統。

竹簡有重量,有體積,刻寫需要工時。這些都是實體成本。當儲存成本極高時,語言會朝向低熵方向演化:

  • 虛詞能省則省
  • 語境依賴極重(解碼需要大量背景知識)
  • 歧義換取密度(讀者端承擔解壓縮負擔)

對比白話文:

vocus|新世代的創作平台

有趣的是,活版印刷大幅降低了複製成本,照理說語言應該走向白話——但文言文仍然主導書面世界數百年。因為寫作者的習慣與社會認可機制的慣性,遠比技術變革的速度慢

白話文運動最終發生,更多是政治與教育普及的需求,而非技術成本。

這個觀察本身就是一個警示:即使最優解存在,系統切換的成本可能讓它長期無法落地。

Token 是現代的竹簡

AI agent 每次被呼叫,都需要把 memory 塞進 context window。Token 是直接成本:計費、速度、context 容量,都和 token 數量正相關。

現有的 memory 格式大多長這樣:

vocus|新世代的創作平台

這是白話文。結構清晰,人讀得懂,但對機器來說充滿冗餘。

如果我們用文言文的邏輯重新設計:

no-trailing-summary; trigger=response_end; reason=user_reads_diff

同樣的語意,token 省了 70% 以上。

關鍵洞察:memory 的唯一讀者是 AI agent

這裡有一個根本性的問題值得釐清:

memory 是為誰而寫的?

傳統 memory 設計預設「人需要能讀懂」,所以用完整句子、加 Why 說明、保留上下文。但仔細想,memory 的實際讀者是 agent 本身。人審查 memory 是偶發需求,不是主流路徑。

這意味著:

  • human-readable 在大多數情境下是偽需求
  • 壓縮的唯一硬性約束是:agent 能 100% decode
  • 其餘的可讀性成本,都是在為一個低頻需求買單

這個邏輯和 LLM embedding 是一樣的:向量記憶體對人完全不可讀,但 agent 的 retrieve 語意還原率反而更高。文字 memory 之所以還在用,是因為人需要 audit 能力,而不是因為它對機器更好。

從 AST 借鑑結構化表示

這時候自然會想到 AST(Abstract Syntax Tree,抽象語法樹)。

在編譯器領域,AST 是把原始碼轉成**結構化中間表示(IR)**的標準手法。原始碼是給人讀的(高冗餘),AST 是給編譯器處理的(結構化、可操作)。

把這個概念移植到 memory:

vocus|新世代的創作平台

具體長這樣:

{
"type": "behavior_rule",
"trigger": { "context": "response_end" },
"action": { "suppress": "summary" },
"condition": { "user_action": "reads_diff" },
"confidence": 0.95,
"raw": "user reads diff directly, finds summaries redundant"
}

AST 相對於 prose memory 的優勢

可 diff:兩條 rule 衝突時,agent 比較節點而非解析自然語言,衝突偵測可以程式化。

可 merge:新 observation 進來時,patch 特定節點而非整段重寫,incremental update 成本低。

可 querytrigger.context == "response_end" 精確 retrieve,不依賴語義相似度,查詢結果確定。

可繼承:子節點 override 父節點,類似 CSS cascade,可以做 context-specific 的行為覆寫。

可版本化:節點帶 schema version,memory 格式演化時可以做 migration 而非全部重寫。

這個設計的根本張力

AST 設計看起來很美,但有一個繞不開的核心問題:

張力一:固定 schema vs 表達彈性

程式語言的 AST 有嚴格 grammar,語義確定。Memory 的 schema 需要人工設計,而觀察的種類是開放的——你無法預先定義所有可能的 node type。

  • Fixed ontology:查詢效率高,但遇到 schema 外的觀察無處放
  • Emergent schema:表達彈性高,但查詢一致性差

這是一個目前沒有標準答案的開放問題。

張力二:壓縮率 vs decode 完整性

文言文的問題是「解壓縮密鑰丟失後語義崩潰」。過度壓縮的 memory:

  • 換模型或換 session 可能 decode 失敗
  • Edge case 無法判斷適用性
  • encode 錯誤無聲無息傳播

最優解不是最大壓縮,而是「剛好能讓同等智力的讀者正確 decode 的最小表達」——這其實也是文言文的設計目標,只是它的「同等智力讀者」預設了四書五經作為共同解碼器。

AI agent 的「共同解碼器」是 pre-training,這個基礎是穩定的,但並非無限可靠。

張力三:auditability vs 壓縮上限

如果完全移除「人要能審查」的約束,理論上可以讓 agent 自己設計一套極度壓縮的內部語言,壓縮率可以趨近理論上限。但你同時失去了:

  • 偵測 encode 錯誤的能力
  • 理解 agent 行為的能力
  • 手動修正錯誤 memory 的能力

auditability 的要求,決定了壓縮的上限。

Hybrid 格式:務實的折衷

考慮以上三個張力,純 AST 和純 prose 都不是最優解。Hybrid 格式更接近實際可落地的方向:

{
"type": "behavior_rule",
"trigger": "response_end",
"action": "suppress_summary",
"raw": "user reads diff directly, finds summaries redundant"
}

結構化 header 負責 routing 和 query,raw 欄位保留自然語言作為 decode 邊界情況的 fallback。

這類似文言文後來發展出的注疏傳統——正文高度壓縮,注疏提供解碼上下文,兩者合讀才是完整資訊。

Python 作為統一引擎

如果要實作這個 memory 系統,Python 是自然的選擇。

更進一步,可以設計單一引擎、雙介面的架構:

memory_engine.py
├── CLI interface ← Bash tool 直接呼叫
│ python memory_engine.py encode "..."
│ python memory_engine.py query "response_end"
│ python memory_engine.py merge <node_id>
│ python memory_engine.py audit

└── Skill interface ← agent 透過 prompt 觸發
複合操作、判斷 subcommand、串接多個操作

同一份邏輯,兩個 entry point,DRY 原則。

if __name__ == "__main__":
parser = argparse.ArgumentParser()
parser.add_argument("command", choices=["encode","query","merge","audit"])
parser.add_argument("input", nargs="?")
args = parser.parse_args()
result = globals()[args.command](args.input)
print(json.dumps(result, ensure_ascii=False))

encode 時需要 LLM 做語義解析,這裡有一個設計選擇:由 Python 內部發 API call,還是由 agent 自己解析後把結果傳給 script?前者讓引擎更自治,後者讓引擎更確定性。這個選擇影響整個依賴架構,值得獨立討論。

可行性小結

vocus|新世代的創作平台

核心結論:方向可行,但不適合一開始就追求極限壓縮。比較務實的做法,是先用 hybrid 格式保留必要上下文,再逐步把穩定、重複出現的 memory 壓成結構化節點。

後記

文言文撐了兩千年,不是因為它最好讀,而是因為它在當時的成本結構下是最優解。當成本結構改變(印刷術、白話文運動),語言才真正轉型。

AI memory 目前的「白話文」格式,是在 context window 相對充裕、token 成本可接受的前提下成立的。當 agent 開始大規模運作、memory 數量指數成長,成本結構會變,最優解也會跟著變。

現在思考壓縮,不是為了立刻重寫所有 memory,而是為了在成本結構改變的時候,不用從零開始想。

想看更多作品、服務與主站整理,請前往 stanwu.org



留言
avatar-img
Stan Wu 吳信典
56會員
201內容數
我是 Stan Wu 吳信典。 我相信:「我們從程式設計的邏輯世界走來,以為萬物都能被預測與控制,直到遇見 AI,才發現智慧不只是規則的堆疊,而是滲透在無數經驗中的模糊與真實。」 我也始終堅信:「簡單,就是極致的美學。」
Stan Wu 吳信典的其他內容
2026/04/12
我最近把自己的 Blog 從 WordPress 遷移到 Hugo。一開始以為這只是一次很單純的工程整理:把 WordPress MySQL 裡的文章匯出成 Markdown,重新做 Hugo theme/template,補上 SEO metadata、sitemap、RSS等等。
Thumbnail
2026/04/12
我最近把自己的 Blog 從 WordPress 遷移到 Hugo。一開始以為這只是一次很單純的工程整理:把 WordPress MySQL 裡的文章匯出成 Markdown,重新做 Hugo theme/template,補上 SEO metadata、sitemap、RSS等等。
Thumbnail
2026/04/09
很多公司一談到支出治理,第一反應就是兩個字:節流。於是流程越加越多、簽核越拉越長、每個人都開始害怕花錢。短期看起來好像比較「有控管」,但久了之後,組織往往不是更有效率,而是更保守、更遲鈍,甚至把本來該投資的事情也一起凍結。
Thumbnail
2026/04/09
很多公司一談到支出治理,第一反應就是兩個字:節流。於是流程越加越多、簽核越拉越長、每個人都開始害怕花錢。短期看起來好像比較「有控管」,但久了之後,組織往往不是更有效率,而是更保守、更遲鈍,甚至把本來該投資的事情也一起凍結。
Thumbnail
2026/02/25
在 2026 年的金融環境下,我們常聽見「以房養老」一詞,但其在法律與精算邏輯上的正確定義應是「逆向抵押貸款」。這項工具與傳統購屋貸款的路徑完全相反:傳統貸款是隨著還款本金減少,房屋淨值增加;而逆向貸款則是隨著撥款,借款本金與利息同步增加,房屋淨值則隨時間逐漸萎縮。
Thumbnail
2026/02/25
在 2026 年的金融環境下,我們常聽見「以房養老」一詞,但其在法律與精算邏輯上的正確定義應是「逆向抵押貸款」。這項工具與傳統購屋貸款的路徑完全相反:傳統貸款是隨著還款本金減少,房屋淨值增加;而逆向貸款則是隨著撥款,借款本金與利息同步增加,房屋淨值則隨時間逐漸萎縮。
Thumbnail
看更多
你可能也想看
Thumbnail
這是一場修復文化與重建精神的儀式,觀眾不需要完全看懂《遊林驚夢:巧遇Hagay》,但你能感受心與土地團聚的渴望,也不急著在此處釐清或定義什麼,但你的在場感受,就是一條線索,關於如何找著自己的路徑、自己的聲音。
Thumbnail
這是一場修復文化與重建精神的儀式,觀眾不需要完全看懂《遊林驚夢:巧遇Hagay》,但你能感受心與土地團聚的渴望,也不急著在此處釐清或定義什麼,但你的在場感受,就是一條線索,關於如何找著自己的路徑、自己的聲音。
Thumbnail
本文分析導演巴里・柯斯基(Barrie Kosky)如何運用極簡的舞臺配置,將布萊希特(Bertolt Brecht)的「疏離效果」轉化為視覺奇觀與黑色幽默,探討《三便士歌劇》在當代劇場中的新詮釋,並藉由舞臺、燈光、服裝、音樂等多方面,分析該作如何在保留批判核心的同時,觸及觀眾的觀看位置與人性幽微。
Thumbnail
本文分析導演巴里・柯斯基(Barrie Kosky)如何運用極簡的舞臺配置,將布萊希特(Bertolt Brecht)的「疏離效果」轉化為視覺奇觀與黑色幽默,探討《三便士歌劇》在當代劇場中的新詮釋,並藉由舞臺、燈光、服裝、音樂等多方面,分析該作如何在保留批判核心的同時,觸及觀眾的觀看位置與人性幽微。
Thumbnail
摘要: 這篇文章來自一位46歲的學習者,YZLIN,他是留學英國STRL大學。參加吳氏日文的課程。最初,他對於學習日文持有懷疑態度,特別是對於理解日文文言文的可能性。然而,在學習過程中,他深受感動,甚至在閱讀文言文「遺書」時落淚,並表示有半天無法學習,因為太過感動。他的學習心得顯示,在短短15天、
Thumbnail
摘要: 這篇文章來自一位46歲的學習者,YZLIN,他是留學英國STRL大學。參加吳氏日文的課程。最初,他對於學習日文持有懷疑態度,特別是對於理解日文文言文的可能性。然而,在學習過程中,他深受感動,甚至在閱讀文言文「遺書」時落淚,並表示有半天無法學習,因為太過感動。他的學習心得顯示,在短短15天、
Thumbnail
在現代社會,良好的文章寫作技巧已經成為一種必要的能力。然而,對於大多數人來說,寫作依然是一個艱難的任務。從現代文到古典文學,本文將介紹一些有效的方法,讓你更容易掌握文章寫作技巧。
Thumbnail
在現代社會,良好的文章寫作技巧已經成為一種必要的能力。然而,對於大多數人來說,寫作依然是一個艱難的任務。從現代文到古典文學,本文將介紹一些有效的方法,讓你更容易掌握文章寫作技巧。
Thumbnail
前面幾回,我們從先秦的《詩經》,一路講到元朝的元曲。這次,讓我們以宏觀的角度,大致總結整個詩歌史變化的脈絡,點出各時期詩歌發展的重點。這回從上古時期的歌謠開始講起,文學如何誕生?詩歌怎麼產生?又為何中國詩歌會以抒情詩為主流?這些問題都可從這篇文章找到答案。
Thumbnail
前面幾回,我們從先秦的《詩經》,一路講到元朝的元曲。這次,讓我們以宏觀的角度,大致總結整個詩歌史變化的脈絡,點出各時期詩歌發展的重點。這回從上古時期的歌謠開始講起,文學如何誕生?詩歌怎麼產生?又為何中國詩歌會以抒情詩為主流?這些問題都可從這篇文章找到答案。
Thumbnail
5 月將於臺北表演藝術中心映演的「2026 北藝嚴選」《海妲・蓋柏樂》,由臺灣劇團「晃晃跨幅町」製作,本文將以從舞台符號、聲音與表演調度切入,討論海妲・蓋柏樂在父權社會結構下的困境,並結合榮格心理學與馮.法蘭茲對「阿尼姆斯」與「永恆少年」原型的分析,理解女人何以走向精神性的操控、毀滅與死亡。
Thumbnail
5 月將於臺北表演藝術中心映演的「2026 北藝嚴選」《海妲・蓋柏樂》,由臺灣劇團「晃晃跨幅町」製作,本文將以從舞台符號、聲音與表演調度切入,討論海妲・蓋柏樂在父權社會結構下的困境,並結合榮格心理學與馮.法蘭茲對「阿尼姆斯」與「永恆少年」原型的分析,理解女人何以走向精神性的操控、毀滅與死亡。
Thumbnail
背景:從冷門配角到市場主線,算力與電力被重新定價   小P從2008進入股市,每一個時期的投資亮點都不同,記得2009蘋果手機剛上市,當時蘋果只要在媒體上提到哪一間供應鏈,隔天股價就有驚人的表現,當時光學鏡頭非常熱門,因為手機第一次搭上鏡頭可以拍照,也造就傳統相機廠的殞落,如今手機已經全面普及,題
Thumbnail
背景:從冷門配角到市場主線,算力與電力被重新定價   小P從2008進入股市,每一個時期的投資亮點都不同,記得2009蘋果手機剛上市,當時蘋果只要在媒體上提到哪一間供應鏈,隔天股價就有驚人的表現,當時光學鏡頭非常熱門,因為手機第一次搭上鏡頭可以拍照,也造就傳統相機廠的殞落,如今手機已經全面普及,題
Thumbnail
人生難在一切要剛剛好,在碰到問題時就有適合的人伸出援手。
Thumbnail
人生難在一切要剛剛好,在碰到問題時就有適合的人伸出援手。
Thumbnail
講到詐騙,在我們的直覺中,似乎教育程度不高的民眾比較容易受騙。但,據統計,假檢警的詐財案中的受害者,年過50,且具有高學歷與高工作資歷的民眾,居然佔了90%! 為什麼書讀得多的佼佼者,反而是詐騙集團待宰的肥羊呢?讀過《夷堅志》中的〈武當劉先生〉,再回顧中研院前副院長劉翠溶女士的詐騙案,你馬上就會懂!
Thumbnail
講到詐騙,在我們的直覺中,似乎教育程度不高的民眾比較容易受騙。但,據統計,假檢警的詐財案中的受害者,年過50,且具有高學歷與高工作資歷的民眾,居然佔了90%! 為什麼書讀得多的佼佼者,反而是詐騙集團待宰的肥羊呢?讀過《夷堅志》中的〈武當劉先生〉,再回顧中研院前副院長劉翠溶女士的詐騙案,你馬上就會懂!
Thumbnail
本片原文:日文的文言文,留英學人讀到哭,從質疑到淚流。 https://vocus.cc/article/654c7d03fd89780001767cbe
Thumbnail
本片原文:日文的文言文,留英學人讀到哭,從質疑到淚流。 https://vocus.cc/article/654c7d03fd89780001767cbe
Thumbnail
天氣影響的不只是心情,更會牽動記憶力、專注力甚至投資決策!本文從科學研究、生理學、心理學及古代文學等面向,探討天氣與情緒的關聯性,並說明如何透過認知調節來理性應對環境變化。
Thumbnail
天氣影響的不只是心情,更會牽動記憶力、專注力甚至投資決策!本文從科學研究、生理學、心理學及古代文學等面向,探討天氣與情緒的關聯性,並說明如何透過認知調節來理性應對環境變化。
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News