
在生成式 AI 爆發的今天,開發者們正面臨一個混亂的戰場。每個人都在手刻自己的Agent(智能體),但當我們談論 Agent 的「狀態管理」、「中斷恢復」或是「跨平台運行」時,往往發現自己正在重複造輪子。
如果 AI Agent 的開發也能像 Docker 容器一樣標準化——寫好定義檔、打包成映像檔(Image)、隨時啟動(Run)、暫停(Commit)甚至分岔(Fork),那會是什麼樣的世界?
這正是開源項目 AgentX 試圖回答的問題。由 Deepractice 團隊開發的 AgentX,不僅僅是一個框架,它更提出了一種全新的 「Docker 風格 Agent 運行時(Runtime)」 哲學。
1. 核心概念:像管理容器一樣管理 Agent
AgentX 最直觀的創新,在於它將 Docker 的生命週期管理引入了 AI Agent 開發。
在傳統開發中,Agent 的狀態往往是短暫且難以追蹤的。但在 AgentX 的設計中,引入了以下對應關係:
- Dockerfile → defineAgent():這是 Agent 的原始定義,包含 System Prompt 和基本設定。
- Image → MetaImage:建置好的靜態產物。
- Container → Session + Agent:正在運行的實例。
這不僅是命名上的致敬,更是功能上的實踐。透過 session.commit(),你可以保存當前的對話狀態;透過 session.resume(),你可以隨時喚醒一個「沉睡」的 Agent;甚至可以使用 session.fork() 來從某個對話節點分岔出另一個平行時空。
誠如專案開發者在架構討論中所述:「Agent 如果死掉了(進程結束),就是一坨 Session。我們要恢復對話,本質上就是拿 Agent 的映像檔,載入一個對話記錄(Session),生成一個新的實例。這就像人睡覺了,醒來時是透過記憶(Session)加上肉體(Image)來恢復運作。」
2. 架構哲學:二元世界與生態系統
AgentX 的底層邏輯建立在一種「二元化」的世界觀上:Application(應用) 與 Ecosystem(生態系統/運行時)。
- Application(描述與結構): 這對應到我們如何「描述」一個 Agent。就像 Java 程式碼是用來描述邏輯,而 Dockerfile 是用來描述環境。在 AgentX 中,這包含了 Agent 的定義、映像檔等靜態結構。
- Ecosystem(運行時與沙箱): 這是 AgentX 真正的野心所在。一個能讓 Agent 跑起來的環境(Runtime),需要具備什麼? 根據開發團隊的定義,一個完整的 Agent 運行沙箱(Sandbox)至少需要:
- 大模型(LLM):大腦。
- 上下文(Context):記憶。
- 工作區(Workspace):執行工具的地方。
- 儲存(Storage):保存數據的 Repository。
AgentX 的目標是構建一個通用的 Runtime,就像作業系統管理 CPU 和磁碟一樣,AgentX 管理著大模型與上下文,讓開發者只需專注於「描述」Agent,而不用擔心底層的「水電」如何運作。
3. 四層事件系統:從「工作流」到「精密監控」
目前的 AI 框架常使用「Workflow(工作流)」的概念,關注的是從 A 到 B 的結果。但 AgentX 認為這還不夠細緻。為了真正掌控 Agent 的行為,AgentX 引入了 4 層事件架構(4-Layer Event System):
- L1 Stream Layer(串流層):處理即時的 token 輸出,如打字機效果。
- L2 State Layer(狀態層):基於 Mealy Machine(米利型有限狀態機),精確管理從「思考」到「回應」再到「工具執行」的狀態轉換。
- L3 Message Layer(訊息層):處理完整的對話訊息,用於歷史紀錄。
- L4 Turn Layer(輪次層):用於分析、計費與效能監控。
這種設計受到了控制論與系統論的啟發。系統中佈滿了「傳感器(Sensors)」來收集事件(Event),並透過「反應器(Reactors)」將這些事件轉化為 UI 更新或日誌記錄。這讓開發者不僅能看到 Agent 的輸出,還能像上帝視角一樣,精確監控 Agent 內部的每一個微小變化。
4. 同構架構:Server 與 Browser 的大一統
在現代 Web 開發中,前後端分離常帶來重複開發的痛苦。AgentX 採用了 同構架構(Isomorphic Architecture),這意味著同一套業務代碼(Application Code)可以同時運行在 Server 端(Node.js)和 Browser 端。
透過抽象化的 Network 層,AgentX 將瀏覽器視為生態系統中的一個「鏡像(Mirror)」或節點。無論是雲端的 Server 還是用戶端的瀏覽器,本質上都是在處理事件流(Event Stream)和狀態同步。這讓開發者可以用同一套 API (createAgentX),在不同環境下無縫切換。
結語:打造 AI 時代的基礎設施
AgentX 的願景並不僅止於一個框架,而是試圖成為 AI Agent 領域的基礎設施(Infrastructure)。正如開發者所言:「這套架構是我們未來的立命之本……就像蓋房子,地基打好了,上面要蓋成什麼樣的產品都可以。」
目前 AgentX 已經開源並支援 Docker 快速部署,提供 Claude、OpenAI 以及本地 Ollama 的支援。如果你正在尋找一個結構嚴謹、狀態管理強大且具備高度擴展性的 Agent 開發框架,AgentX 絕對值得你關注。
專案連結: GitHub - Deepractice/AgentX
本文參考資料來源於 AgentX GitHub 官方文件及開發團隊架構訪談紀錄。























