
一開始,我們還在問:什麼是 Agent?
現在,許多人每天都在用各式各樣的 Agent,從寫程式、寫文件,到整理資料、做規劃。
但在實際使用的過程中,我們越來越清楚地感受到一個問題:
這些 Agent「很聰明」,卻不一定「很專業」。
它們像是一位智商 300 的天才,可以現場推理一切;
但在需要專業經驗、穩定流程、組織 know-how 的時候,它們往往抓不到重點、也缺乏一致性。
於是,團隊做了一個關鍵決定:
與其一直重建新的 Agent,不如開始系統性地打造「Skills(技能)」。
本文整理這場分享的重點:
原文:https://www.youtube.com/watch?v=CEvIs9y1uog
為什麼要從 Agent 轉向 Skills? Skills 是什麼? 它們怎麼跟 MCP、Agent runtime 一起形成新的 AI 架構? 以及這對企業與開發者意味著什麼。
從「聰明」到「專業」:Agent 的缺口
今天的 Agent 有幾個明顯的特徵:
- 推理能力強,可以處理複雜任務
- 能夠調用工具、API、瀏覽網頁、操作檔案系統
- 可以在單一任務中做跨步驟、自主規劃
問題在於:
當任務跨入「專業工作」範疇,例如:
- 做年度稅務申報
- 撰寫符合公司標準的法務文件
- 依照組織內部流程整理財報
- 遵循企業既有的合規流程或內部標準
這些 Agent 雖然聰明,但缺乏「穩定可複用的專業流程」。
就像演講裡提到的比喻:
做 2025 年的報稅,你會選擇
Mahesh:智商 300 的數學天才,從頭推導稅法 還是 Barry:多年經驗的職業報稅專家?大部分人都會選 Barry。
今天的 Agent 大多像 Mahesh:
推理很強,但要靠使用者一步一步教,缺少累積下來的固定專業流程。 它們也很難真正「學會」某個組織的最佳實務,而且常常不具延續性。
Skills 是什麼?一句話:有組織的資料夾
為了解決這個問題,團隊提出了一個很簡單、但很有力的概念:Agent Skills。
Skills 是什麼?
一句話:
Skills 是為 Agent 打包的「可複用程序知識」,
具體形式就是:有組織結構的資料夾(folder)。
這個設計刻意保持非常簡單:
- 每個 Skill 就是一個資料夾
- 裡面可以包含:
- 說明文件(例如:skill.md)
- 流程說明、標準作業程序(SOP)
- 程式碼、腳本(scripts)
- 可執行檔、資產檔、樣板檔
- 其他輔助資料
- 任何人都可以用自己熟悉的方式管理:
- 放在 Git 版控
- 放在 Google Drive
- 用 zip 打包分享給同事或團隊
這樣的設計有幾個關鍵優點:
- 人人都懂的抽象:資料夾是電腦世界最通用的概念之一
- 人跟 Agent 都能讀寫:不需要特殊格式,Markdown、程式碼、文件都可以
- 易於分發與管理:可以像軟體一樣版本化、共享、演進
為什麼不用傳統工具?為什麼要「用程式碼當工具」?
以往我們會為 Agent 提供「工具(tools)」,通常是:
- 某個 API 呼叫
- 某段固定功能的程式
- 某種操作介面
但這裡有幾個老問題:
- 工具的說明文件(prompt / description)寫得不好時,模型很難正確使用
- 當工具設計不佳時,模型沒辦法自己改,只能卡在那裡
- 工具定義往往必須塞進 context window
→ 工具一多,context 就爆了
Skills 對此提出了另一種方式:
讓「程式碼」本身成為工具,而且放在檔案系統中。
程式碼有幾個特點特別適合這個角色:
- 自帶文件性(self-documenting)
→ 看到程式本身就能猜到用途 - 可被 Agent(或人)修改
→ 如果不夠好,用 Agent 幫忙修 - 不必常駐在 Context 中
→ 需要時才載入、執行
分享中提到一個例子:
團隊發現 Claude 經常為簡報重複寫同一種 Python 腳本來套用格式。 於是他們直接叫 Claude:
- 把這個腳本寫出來
- 存進某個 Skill 裡
- 下次再遇到類似需求,直接執行這個腳本
結果:
- 工作流程變得穩定又一致
- Agent 不需要每次從頭「想一次」怎麼做
- 工具本身也是由 Agent 產生,並可持續優化
避免塞爆 Context:Skills 的「漸進式揭露」
一個 Skill 裡可能有很多東西:說明、流程、範本、腳本…
如果全部一次塞進模型的 context,一定撐不住。
所以 Skills 被設計成漸進式揭露(progressive disclosure):
- 一開始只曝光 Skill 的 metadata
- 比如名稱、簡要描述、用途
- 告訴模型:「你有這項技能喔」
- 當 Agent 判斷需要某個 Skill 時
- 再讀取 skill.md 的完整內容(核心指引與目錄)
- 依需要再打開更深一層的檔案、腳本、範本
優點是:
- 可以同時掛載「幾百個甚至上千個 Skills」
- 只有真正用到的 Skill 才會進入 context
- Skills 自然就變得「可組合」(composable)
Skills 的三大類型:從基礎能力到企業專屬知識
短短五週內,Skills 的生態系就已經快速成長,出現幾種主要類別:
1. 基礎/通用 Skills(Foundational Skills)
這類 Skills 讓 Agent 獲得新的基本能力或泛用專業能力。例如:
- 撰寫、編輯專業品質的文件(文件處理 Skills)
- 進階資料分析、特定領域數學或統計流程
- 用 Python 進行科學計算、生物資訊分析等
Anthropic 自己就打造了一系列文件處理 Skills,
讓 Claude 能製作、編輯高品質的 Office 文件。
第三方如 Cadence,則提供科學研究與臨床 EHR 分析相關的 Skills,
幫 Claude 更好地使用 Python 生醫相關的 libraries。
2. 生態系合作夥伴 Skills(Third-party Skills)
這類 Skills 由 SaaS 或工具供應商製作,
目標是讓 Agent 更好地使用他們的產品。
例子包括:
- BrowserBase
把他們的開源瀏覽器自動化工具 StageHand 包成 Skill, 讓 Claude 能用 StageHand 更穩定地操作瀏覽器、瀏覽網頁、進行自動化操作。 - Notion
提供 Skills 讓 Claude 能深入理解、檢索與整理 Notion 工作空間內的大量內容, 做到真正的跨空間研究與內容整合。
3. 企業/團隊內部 Skills(Enterprise & Team Skills)
這是目前最讓人興奮的一塊:
大型企業開始用 Skills 來「教會 Agent 組織的工作方式」。
例如:
- Fortune 100 公司
- 把公司內部的最佳實務、作業流程、合規要求變成 Skills
- 教 Agent 如何和內網系統互動、處理內部資料
- 超大型開發者生產力團隊
- 為上千/上萬開發者設計專屬的 Coding Skills
- 包含:程式碼風格、架構原則、常見範本、review 準則
- 讓 Agent 在該公司環境下寫出的程式碼符合內規與習慣
共同特點是:
- 不一定需要工程師才能寫 Skill
- 財會、人資、法務、營運等非技術人員,也能把自己的專業流程寫成 Skill
- 讓 Agent 真的變成組織的一份子,而不是一個「通用聊天機器人」
Skills 與 MCP:能力 = 連結外界 + 專業流程
今年另一個重要基礎設施是 MCP(Model Context Protocol),
它成為 Agent 連結外部世界的標準。
整體架構可以這樣看:
- MCP servers:
提供外部連線能力 - API、資料庫、SaaS、內部系統
- 檔案、知識庫、各種外界資源
- Skills:
提供「如何做事」的專業流程 - 把多個 MCP 工具串成完整 workflow
- 固定化某個任務的步驟、規範、判斷邏輯
結果是:
MCP 提供「連到哪裡」
Skills 提供「要怎麼做」
許多 Skills 就是對多個 MCP 工具的協調與編排,
讓 Agent 能用一套穩定流程,反覆做出品質一致的結果。
新一代通用 Agent 架構:模型、Runtime、MCP、Skills
演講中提出了一個正在成形的「通用 Agent 架構」,大致包含:
Agent Loop(代理循環)
- 負責管理模型的內部上下文(context)
- 控制每輪輸入輸出的 token
- 決策何時呼叫工具、何時讀寫檔案
Runtime Environment(執行環境)
提供:
- 檔案系統
- 執行程式碼的能力(例如 Bash, Python, Node 等)
- 讓 Agent 能像一個使用電腦的人一樣:寫檔案、跑腳本、改程式
MCP Servers
- 作為對外的工具與資料來源
- 把 Agent 接上真實世界的系統與資料庫
Skills Library
一大組可插拔 Skills(數百甚至數千)Agent
在「執行某任務時」決定載入哪個 Skill
Skills 統一封裝:
- 專業流程(SOP)
- 組織規範
- 具體執行腳本與範本
當要部署到新的產業垂直領域時,例如:
- 金融服務
- 生命科學/醫療
工作大致變成:
- 選好/配置好一組合適的 MCP servers(對接該產業的系統與資料)
- 配上一套相關的 Skills(該產業的專業流程與範本)
Anthropic 自己已經用這個模式推出面向金融與生命科學的方案,
顯示這樣的組合方式在實務上是可行的。
讓 Skills 像軟體一樣被打造、測試與維護
隨著 Skills 越來越複雜,團隊開始把它們當作「軟體」看待,而不只是 Prompt 筆記:
未來會重點發展的方向包括:
測試與評估(Testing & Evaluation)
- 確認 Agent 有沒有在正確情境下載入 Skills
- 檢查 Skill 是否被正確觸發、是否產生預期的結果
- 定期評估使用 Skill 後的輸出品質
版本管理(Versioning)
- Skills 隨時間演進,Agent 行為也會變
- 需要清楚記錄版本、變更、影響範圍
- 保證:在特定版本的 Skill 下,Agent 行為是可追溯的
依賴管理(Dependencies)
Skill 之間可以顯式宣告依賴關係
- 依賴其他 Skills
- 依賴特定 MCP servers
- 依賴 Runtime 中的某些套件或環境
- 讓同一個 Skill 在不同執行環境下,更可預測、更穩定
這些都是在為未來鋪路:
當 Skills 變成企業級、長期維護的資產時,它需要整套工程化治理工具。
組織中的「集體知識庫」:Skills 作為可演化的能力層
從企業角度看,Skills 的願景是打造一個:
由人與 Agent 共同維護、會不斷成長的「能力知識庫」。
想像一個場景:
- 團隊成員每天在用 Claude 處理各種任務
- 當發現一個流程值得複用時:
- 讓 Claude 把流程整理好
- 存成一個 Skill
- 隨著時間:
- Skills library 越來越豐富、越來越精準
- 新加入的同事只要用 Agent,就能立刻套用團隊累積的最佳實務
- 不必從零摸索「這個公司是怎麼做事的」
這樣的累積不只在單一公司內有價值,也會:
- 延伸到更廣大的社群與生態系
- 像今天的開源套件、MCP server 一樣
- 別人寫的 Skills 也能讓你的 Agent 更強
Skills 與「持續學習」:讓 Day 30 的 Agent 比 Day 1 聰明
Skills 也是朝向「持續學習」的一個具體步驟。
它的核心想法是:
把可複用的「做事方法」寫下來
- 而不是只讓 Agent 一次性在對話中即興推理
用標準化格式(Skill)記錄
確保:
- 今天的 Claude 寫下的東西
- 明天的 Claude 或後續版本
- 都能有效讀取與運用
這樣一來,「學習」變得可轉移:
- 不只是在單次對話中短暫存在的 context
- 而是會累積在檔案系統/版本庫中的實體資產
以時間軸來看:
- Day 1:Claude 對你的組織一無所知,只能靠通用能力
- Day 30:已經累積了一組你們共同打造的 Skills
- 你的工作風格
- 團隊流程
- 作業標準
- 常見任務的固定做法
這些能力會持續成長、修正、淘汰、替換,
形成一個真正會進化的「工作助理」。
目前 Claude 已經能透過「Skill Creator Skill」幫你生成新的 Skills,
未來會在這個方向上持續擴展。
類比電腦史:模型 = 處理器,Runtime = 作業系統,Skills = 應用程式
演講最後用了電腦史作類比:
- 模型(Model)像處理器(CPU)
- 需要巨額投入,潛力巨大
- 但光有 CPU 本身沒什麼用
- Agent Runtime 像作業系統(OS)
- 負責調度資源、管理流程、提供統一介面
- 讓 CPU 的能力可以實際被運用
- Skills 像應用程式(Applications)
- 真正承載了「人類的具體專業與觀點」
- 不需要世界頂尖大廠才能開發
→ 數百萬開發者、專業人士都能參與
硬體跟 OS 的層次,會由少數公司主導;
但真正多元、創新的,是「上層應用」。
Skills 的目標,就是把這一層完全打開給所有人:
任何人只要「把東西放進一個資料夾」
就有機會打造出一個讓 Agent 更懂你工作方式的能力模組。
結語:別再重造 Agent,開始打造 Skills
綜合這場分享,可以看到一個清晰的轉向:
- 不再把重心放在「為每個領域造一個新 Agent」
- 而是:
- 用通用 Agent + 通用 Runtime(檔案系統+執行程式)
- 用 MCP 負責連結外部世界
- 用 Skills 負責封裝專業知識與流程
對個人與團隊來說:
- 你不必自己訓練模型,也不必自建一套複雜 Agent 系統
- 你可以從今天就開始:
- 把你日常工作的 SOP、範本、腳本整理進一個 Skill
- 讓 Agent 從此用「你的方式」做事
- 隨著時間持續改良與擴張
對整個生態系來說:
- Skills 會像軟體一樣被開發、分享、版本化
- 一個人或一個組織的成果,可以立刻讓其他人的 Agent 更強大
也因此,分享者在最後呼籲:
是時候少花時間重建 Agent,
多花時間打造 Skills 了。
如果你願意開始只是一個簡單的資料夾,加上一個寫好的 skill.md,
你就已經踏進這個新的 Agent 開發時代。




















