Agent 到 Skills:讓 AI 真的變成「會做事的專家」, 不要再建構 Agent, 建構 Skill

更新 發佈閱讀 16 分鐘
vocus|新世代的創作平台


過去一年,我們對「Agent」的理解有了巨大變化。
一開始,我們還在問:什麼是 Agent?
現在,許多人每天都在用各式各樣的 Agent,從寫程式、寫文件,到整理資料、做規劃。
但在實際使用的過程中,我們越來越清楚地感受到一個問題:
這些 Agent「很聰明」,卻不一定「很專業」。

它們像是一位智商 300 的天才,可以現場推理一切;
但在需要專業經驗、穩定流程、組織 know-how 的時候,它們往往抓不到重點、也缺乏一致性。
於是,團隊做了一個關鍵決定:

與其一直重建新的 Agent,不如開始系統性地打造「Skills(技能)」

本文整理這場分享的重點:
原文:https://www.youtube.com/watch?v=CEvIs9y1uog

為什麼要從 Agent 轉向 Skills? Skills 是什麼? 它們怎麼跟 MCP、Agent runtime 一起形成新的 AI 架構? 以及這對企業與開發者意味著什麼。



從「聰明」到「專業」:Agent 的缺口

今天的 Agent 有幾個明顯的特徵:

  • 推理能力強,可以處理複雜任務
  • 能夠調用工具、API、瀏覽網頁、操作檔案系統
  • 可以在單一任務中做跨步驟、自主規劃

問題在於:

當任務跨入「專業工作」範疇,例如:

  • 做年度稅務申報
  • 撰寫符合公司標準的法務文件
  • 依照組織內部流程整理財報
  • 遵循企業既有的合規流程或內部標準

這些 Agent 雖然聰明,但缺乏「穩定可複用的專業流程」。

就像演講裡提到的比喻:

做 2025 年的報稅,你會選擇

Mahesh:智商 300 的數學天才,從頭推導稅法 還是 Barry:多年經驗的職業報稅專家?

大部分人都會選 Barry。

今天的 Agent 大多像 Mahesh:

推理很強,但要靠使用者一步一步教,缺少累積下來的固定專業流程。 它們也很難真正「學會」某個組織的最佳實務,而且常常不具延續性。


Skills 是什麼?一句話:有組織的資料夾

為了解決這個問題,團隊提出了一個很簡單、但很有力的概念:Agent Skills

Skills 是什麼?

一句話:

Skills 是為 Agent 打包的「可複用程序知識」,

具體形式就是:有組織結構的資料夾(folder)

這個設計刻意保持非常簡單:

  • 每個 Skill 就是一個資料夾
  • 裡面可以包含:
    • 說明文件(例如:skill.md)
    • 流程說明、標準作業程序(SOP)
    • 程式碼、腳本(scripts)
    • 可執行檔、資產檔、樣板檔
    • 其他輔助資料
  • 任何人都可以用自己熟悉的方式管理:
    • 放在 Git 版控
    • 放在 Google Drive
    • 用 zip 打包分享給同事或團隊

這樣的設計有幾個關鍵優點:

  1. 人人都懂的抽象:資料夾是電腦世界最通用的概念之一
  2. 人跟 Agent 都能讀寫:不需要特殊格式,Markdown、程式碼、文件都可以
  3. 易於分發與管理:可以像軟體一樣版本化、共享、演進

為什麼不用傳統工具?為什麼要「用程式碼當工具」?

以往我們會為 Agent 提供「工具(tools)」,通常是:

  • 某個 API 呼叫
  • 某段固定功能的程式
  • 某種操作介面

但這裡有幾個老問題:

  • 工具的說明文件(prompt / description)寫得不好時,模型很難正確使用
  • 當工具設計不佳時,模型沒辦法自己改,只能卡在那裡
  • 工具定義往往必須塞進 context window
    → 工具一多,context 就爆了

Skills 對此提出了另一種方式:

讓「程式碼」本身成為工具,而且放在檔案系統中。

程式碼有幾個特點特別適合這個角色:

  • 自帶文件性(self-documenting)
    → 看到程式本身就能猜到用途
  • 可被 Agent(或人)修改
    → 如果不夠好,用 Agent 幫忙修
  • 不必常駐在 Context 中
    → 需要時才載入、執行

分享中提到一個例子:

團隊發現 Claude 經常為簡報重複寫同一種 Python 腳本來套用格式。 於是他們直接叫 Claude:

  1. 把這個腳本寫出來
  2. 存進某個 Skill 裡
  3. 下次再遇到類似需求,直接執行這個腳本

結果:

  • 工作流程變得穩定又一致
  • Agent 不需要每次從頭「想一次」怎麼做
  • 工具本身也是由 Agent 產生,並可持續優化

避免塞爆 Context:Skills 的「漸進式揭露」

一個 Skill 裡可能有很多東西:說明、流程、範本、腳本…

如果全部一次塞進模型的 context,一定撐不住。

所以 Skills 被設計成漸進式揭露(progressive disclosure)

  1. 一開始只曝光 Skill 的 metadata
    • 比如名稱、簡要描述、用途
    • 告訴模型:「你有這項技能喔」
  2. 當 Agent 判斷需要某個 Skill 時
    • 再讀取 skill.md 的完整內容(核心指引與目錄)
    • 依需要再打開更深一層的檔案、腳本、範本

優點是:

  • 可以同時掛載「幾百個甚至上千個 Skills」
  • 只有真正用到的 Skill 才會進入 context
  • Skills 自然就變得「可組合」(composable)

Skills 的三大類型:從基礎能力到企業專屬知識

短短五週內,Skills 的生態系就已經快速成長,出現幾種主要類別:

1. 基礎/通用 Skills(Foundational Skills)

這類 Skills 讓 Agent 獲得新的基本能力或泛用專業能力。例如:

  • 撰寫、編輯專業品質的文件(文件處理 Skills)
  • 進階資料分析、特定領域數學或統計流程
  • 用 Python 進行科學計算、生物資訊分析等

Anthropic 自己就打造了一系列文件處理 Skills,

讓 Claude 能製作、編輯高品質的 Office 文件。

第三方如 Cadence,則提供科學研究與臨床 EHR 分析相關的 Skills,

幫 Claude 更好地使用 Python 生醫相關的 libraries。

2. 生態系合作夥伴 Skills(Third-party Skills)

這類 Skills 由 SaaS 或工具供應商製作,

目標是讓 Agent 更好地使用他們的產品。

例子包括:

  • BrowserBase
    把他們的開源瀏覽器自動化工具 StageHand 包成 Skill, 讓 Claude 能用 StageHand 更穩定地操作瀏覽器、瀏覽網頁、進行自動化操作。
  • Notion
    提供 Skills 讓 Claude 能深入理解、檢索與整理 Notion 工作空間內的大量內容, 做到真正的跨空間研究與內容整合。

3. 企業/團隊內部 Skills(Enterprise & Team Skills)

這是目前最讓人興奮的一塊:

大型企業開始用 Skills 來「教會 Agent 組織的工作方式」。

例如:

  • Fortune 100 公司
    • 把公司內部的最佳實務、作業流程、合規要求變成 Skills
    • 教 Agent 如何和內網系統互動、處理內部資料
  • 超大型開發者生產力團隊
    • 為上千/上萬開發者設計專屬的 Coding Skills
    • 包含:程式碼風格、架構原則、常見範本、review 準則
    • 讓 Agent 在該公司環境下寫出的程式碼符合內規與習慣

共同特點是:

  • 不一定需要工程師才能寫 Skill
  • 財會、人資、法務、營運等非技術人員,也能把自己的專業流程寫成 Skill
  • 讓 Agent 真的變成組織的一份子,而不是一個「通用聊天機器人」

Skills 與 MCP:能力 = 連結外界 + 專業流程

今年另一個重要基礎設施是 MCP(Model Context Protocol),

它成為 Agent 連結外部世界的標準。

整體架構可以這樣看:

  • MCP servers
    提供外部連線能力
    • API、資料庫、SaaS、內部系統
    • 檔案、知識庫、各種外界資源
  • Skills
    提供「如何做事」的專業流程
    • 把多個 MCP 工具串成完整 workflow
    • 固定化某個任務的步驟、規範、判斷邏輯

結果是:

MCP 提供「連到哪裡」

Skills 提供「要怎麼做」

許多 Skills 就是對多個 MCP 工具的協調與編排

讓 Agent 能用一套穩定流程,反覆做出品質一致的結果。


新一代通用 Agent 架構:模型、Runtime、MCP、Skills

演講中提出了一個正在成形的「通用 Agent 架構」,大致包含:

Agent Loop(代理循環)

  1. 負責管理模型的內部上下文(context)
  2. 控制每輪輸入輸出的 token
  3. 決策何時呼叫工具、何時讀寫檔案

Runtime Environment(執行環境)

提供:

  1. 檔案系統
  2. 執行程式碼的能力(例如 Bash, Python, Node 等)
  3. 讓 Agent 能像一個使用電腦的人一樣:寫檔案、跑腳本、改程式

MCP Servers

  1. 作為對外的工具與資料來源
  2. 把 Agent 接上真實世界的系統與資料庫


Skills Library

一大組可插拔 Skills(數百甚至數千)Agent

在「執行某任務時」決定載入哪個 Skill

Skills 統一封裝:

  1. 專業流程(SOP)
  2. 組織規範
  3. 具體執行腳本與範本

當要部署到新的產業垂直領域時,例如:

  • 金融服務
  • 生命科學/醫療

工作大致變成:

  1. 選好/配置好一組合適的 MCP servers(對接該產業的系統與資料)
  2. 配上一套相關的 Skills(該產業的專業流程與範本)

Anthropic 自己已經用這個模式推出面向金融與生命科學的方案,

顯示這樣的組合方式在實務上是可行的。



讓 Skills 像軟體一樣被打造、測試與維護

隨著 Skills 越來越複雜,團隊開始把它們當作「軟體」看待,而不只是 Prompt 筆記:

未來會重點發展的方向包括:

測試與評估(Testing & Evaluation)

  1. 確認 Agent 有沒有在正確情境下載入 Skills
  2. 檢查 Skill 是否被正確觸發、是否產生預期的結果
  3. 定期評估使用 Skill 後的輸出品質

版本管理(Versioning)

  1. Skills 隨時間演進,Agent 行為也會變
  2. 需要清楚記錄版本、變更、影響範圍
  3. 保證:在特定版本的 Skill 下,Agent 行為是可追溯的

依賴管理(Dependencies)

Skill 之間可以顯式宣告依賴關係

  1. 依賴其他 Skills
  2. 依賴特定 MCP servers
  3. 依賴 Runtime 中的某些套件或環境
  4. 讓同一個 Skill 在不同執行環境下,更可預測、更穩定

這些都是在為未來鋪路:

當 Skills 變成企業級、長期維護的資產時,它需要整套工程化治理工具。



組織中的「集體知識庫」:Skills 作為可演化的能力層

從企業角度看,Skills 的願景是打造一個:

由人與 Agent 共同維護、會不斷成長的「能力知識庫」。

想像一個場景:

  • 團隊成員每天在用 Claude 處理各種任務
  • 當發現一個流程值得複用時:
    • 讓 Claude 把流程整理好
    • 存成一個 Skill
  • 隨著時間:
    • Skills library 越來越豐富、越來越精準
    • 新加入的同事只要用 Agent,就能立刻套用團隊累積的最佳實務
    • 不必從零摸索「這個公司是怎麼做事的」

這樣的累積不只在單一公司內有價值,也會:

  • 延伸到更廣大的社群與生態系
  • 像今天的開源套件、MCP server 一樣
  • 別人寫的 Skills 也能讓你的 Agent 更強

Skills 與「持續學習」:讓 Day 30 的 Agent 比 Day 1 聰明

Skills 也是朝向「持續學習」的一個具體步驟。

它的核心想法是:

把可複用的「做事方法」寫下來

  1. 而不是只讓 Agent 一次性在對話中即興推理

用標準化格式(Skill)記錄

確保:

  1. 今天的 Claude 寫下的東西
  2. 明天的 Claude 或後續版本
  3. 都能有效讀取與運用

這樣一來,「學習」變得可轉移:

  • 不只是在單次對話中短暫存在的 context
  • 而是會累積在檔案系統/版本庫中的實體資產

以時間軸來看:

  • Day 1:Claude 對你的組織一無所知,只能靠通用能力
  • Day 30:已經累積了一組你們共同打造的 Skills
    • 你的工作風格
    • 團隊流程
    • 作業標準
    • 常見任務的固定做法

這些能力會持續成長、修正、淘汰、替換,

形成一個真正會進化的「工作助理」。

目前 Claude 已經能透過「Skill Creator Skill」幫你生成新的 Skills,

未來會在這個方向上持續擴展。


類比電腦史:模型 = 處理器,Runtime = 作業系統,Skills = 應用程式

演講最後用了電腦史作類比:

  • 模型(Model)像處理器(CPU)
    • 需要巨額投入,潛力巨大
    • 但光有 CPU 本身沒什麼用
  • Agent Runtime 像作業系統(OS)
    • 負責調度資源、管理流程、提供統一介面
    • 讓 CPU 的能力可以實際被運用
  • Skills 像應用程式(Applications)
    • 真正承載了「人類的具體專業與觀點」
    • 不需要世界頂尖大廠才能開發
      → 數百萬開發者、專業人士都能參與

硬體跟 OS 的層次,會由少數公司主導;

但真正多元、創新的,是「上層應用」。

Skills 的目標,就是把這一層完全打開給所有人:

任何人只要「把東西放進一個資料夾」

就有機會打造出一個讓 Agent 更懂你工作方式的能力模組。

結語:別再重造 Agent,開始打造 Skills

綜合這場分享,可以看到一個清晰的轉向:

  • 不再把重心放在「為每個領域造一個新 Agent」
  • 而是:
    • 用通用 Agent + 通用 Runtime(檔案系統+執行程式)
    • 用 MCP 負責連結外部世界
    • 用 Skills 負責封裝專業知識與流程

對個人與團隊來說:

  • 你不必自己訓練模型,也不必自建一套複雜 Agent 系統
  • 你可以從今天就開始:
    • 把你日常工作的 SOP、範本、腳本整理進一個 Skill
    • 讓 Agent 從此用「你的方式」做事
    • 隨著時間持續改良與擴張

對整個生態系來說:

  • Skills 會像軟體一樣被開發、分享、版本化
  • 一個人或一個組織的成果,可以立刻讓其他人的 Agent 更強大

也因此,分享者在最後呼籲:

是時候少花時間重建 Agent,

多花時間打造 Skills 了。

如果你願意開始只是一個簡單的資料夾,加上一個寫好的 skill.md,

你就已經踏進這個新的 Agent 開發時代。

留言
avatar-img
我人生遊戲的通關討論區
41會員
114內容數
對我來說 人生就是一個遊戲 活得開心,活得漂亮,活得成功,活得有意義 都是這場遊戲的一個個任務 我想要把這個遊戲打通關 在這裡我會分享一些我自己的經驗 把遊戲打通關的一些技巧 打通關的過程 和我自己發現的小 bug,或捷徑 遇到的喜怒哀樂 遇到的困難 遇到的挫折 歡迎大家一起來摸透和想受 這場人生遊戲
2025/12/12
本文深入整理 Elon Musk 與 Nikhil Kamath(Zerodha 共同創辦人)的對談內容,涵蓋 X(原 Twitter)的定位、AI 發展下的「不用工作的世界」、Starlink 的網路基礎設施、AI 的潛在風險與核心價值、模擬宇宙的可能性,以及對年輕創業者、人口危機、的務實建議。
Thumbnail
2025/12/12
本文深入整理 Elon Musk 與 Nikhil Kamath(Zerodha 共同創辦人)的對談內容,涵蓋 X(原 Twitter)的定位、AI 發展下的「不用工作的世界」、Starlink 的網路基礎設施、AI 的潛在風險與核心價值、模擬宇宙的可能性,以及對年輕創業者、人口危機、的務實建議。
Thumbnail
2025/12/07
本文深入整理知名 Rust 佈道者 John Jensen 對 Rust、Go、C++、AI、產業採用、人才市場、軟體工程未來十年的觀點。Jensen 分享他從 MIT ,AWS 工程師到首席工程師的經驗,探討 Rust 的安全性與效能優勢、挑戰與推力,以及 AI 的實際能力與對工程師的影響。
Thumbnail
2025/12/07
本文深入整理知名 Rust 佈道者 John Jensen 對 Rust、Go、C++、AI、產業採用、人才市場、軟體工程未來十年的觀點。Jensen 分享他從 MIT ,AWS 工程師到首席工程師的經驗,探討 Rust 的安全性與效能優勢、挑戰與推力,以及 AI 的實際能力與對工程師的影響。
Thumbnail
2025/12/02
本文深入探討 Canva 共同創辦人兼 CEO Melanie Perkins 的創業方法論,重點解析「逆向構築未來」的 Column B 思維、設定瘋狂大目標、將混沌轉為清晰、從投資拒絕中學習、經歷痛苦的產品重寫期、用戶共創、AI 應用策略、創辦人續航力、將公益融入 DNA。
Thumbnail
2025/12/02
本文深入探討 Canva 共同創辦人兼 CEO Melanie Perkins 的創業方法論,重點解析「逆向構築未來」的 Column B 思維、設定瘋狂大目標、將混沌轉為清晰、從投資拒絕中學習、經歷痛苦的產品重寫期、用戶共創、AI 應用策略、創辦人續航力、將公益融入 DNA。
Thumbnail
看更多
你可能也想看
Thumbnail
微軟與輝達宣布最多投資 150 億美元給 Anthropic,而 Anthropic 也承諾向 Azure 採購 300 億美元算力,並大量使用 NVIDIA Blackwell 等新 GPU。
Thumbnail
微軟與輝達宣布最多投資 150 億美元給 Anthropic,而 Anthropic 也承諾向 Azure 採購 300 億美元算力,並大量使用 NVIDIA Blackwell 等新 GPU。
Thumbnail
背景:從冷門配角到市場主線,算力與電力被重新定價   小P從2008進入股市,每一個時期的投資亮點都不同,記得2009蘋果手機剛上市,當時蘋果只要在媒體上提到哪一間供應鏈,隔天股價就有驚人的表現,當時光學鏡頭非常熱門,因為手機第一次搭上鏡頭可以拍照,也造就傳統相機廠的殞落,如今手機已經全面普及,題
Thumbnail
背景:從冷門配角到市場主線,算力與電力被重新定價   小P從2008進入股市,每一個時期的投資亮點都不同,記得2009蘋果手機剛上市,當時蘋果只要在媒體上提到哪一間供應鏈,隔天股價就有驚人的表現,當時光學鏡頭非常熱門,因為手機第一次搭上鏡頭可以拍照,也造就傳統相機廠的殞落,如今手機已經全面普及,題
Thumbnail
AI的浪潮正同時改寫政府政策、硬體設計與交通產業。 Anthropic呼籲各國提前部署AI應對機制,為經濟與勞動轉型設下安全網; 蘋果以M5晶片推進AI硬體革命,將運算力融入所有裝置; 而本田則第四度加碼Helm.ai,加速自動駕駛從「輔助」邁向「自學」。
Thumbnail
AI的浪潮正同時改寫政府政策、硬體設計與交通產業。 Anthropic呼籲各國提前部署AI應對機制,為經濟與勞動轉型設下安全網; 蘋果以M5晶片推進AI硬體革命,將運算力融入所有裝置; 而本田則第四度加碼Helm.ai,加速自動駕駛從「輔助」邁向「自學」。
Thumbnail
本文分析導演巴里・柯斯基(Barrie Kosky)如何運用極簡的舞臺配置,將布萊希特(Bertolt Brecht)的「疏離效果」轉化為視覺奇觀與黑色幽默,探討《三便士歌劇》在當代劇場中的新詮釋,並藉由舞臺、燈光、服裝、音樂等多方面,分析該作如何在保留批判核心的同時,觸及觀眾的觀看位置與人性幽微。
Thumbnail
本文分析導演巴里・柯斯基(Barrie Kosky)如何運用極簡的舞臺配置,將布萊希特(Bertolt Brecht)的「疏離效果」轉化為視覺奇觀與黑色幽默,探討《三便士歌劇》在當代劇場中的新詮釋,並藉由舞臺、燈光、服裝、音樂等多方面,分析該作如何在保留批判核心的同時,觸及觀眾的觀看位置與人性幽微。
Thumbnail
在人工智慧模型推陳出新的浪潮中,我們很容易對各種版本的更新感到麻木。然而,Anthropic 公司於 2025 年 9 月 30 日發布的 Claude 4.5 Sonnet,值得我們停下腳步探究。
Thumbnail
在人工智慧模型推陳出新的浪潮中,我們很容易對各種版本的更新感到麻木。然而,Anthropic 公司於 2025 年 9 月 30 日發布的 Claude 4.5 Sonnet,值得我們停下腳步探究。
Thumbnail
5 月將於臺北表演藝術中心映演的「2026 北藝嚴選」《海妲・蓋柏樂》,由臺灣劇團「晃晃跨幅町」製作,本文將以從舞台符號、聲音與表演調度切入,討論海妲・蓋柏樂在父權社會結構下的困境,並結合榮格心理學與馮.法蘭茲對「阿尼姆斯」與「永恆少年」原型的分析,理解女人何以走向精神性的操控、毀滅與死亡。
Thumbnail
5 月將於臺北表演藝術中心映演的「2026 北藝嚴選」《海妲・蓋柏樂》,由臺灣劇團「晃晃跨幅町」製作,本文將以從舞台符號、聲音與表演調度切入,討論海妲・蓋柏樂在父權社會結構下的困境,並結合榮格心理學與馮.法蘭茲對「阿尼姆斯」與「永恆少年」原型的分析,理解女人何以走向精神性的操控、毀滅與死亡。
Thumbnail
網路安全的世界,正在進入一個由 AI 主導的新戰場。根據最新統計,2025 年全球由 AI 驅動的網路安全事件已激增 47%,這不再是未來式,而是現在進行式。從自動生成釣魚郵件到開發客製化勒索軟體,AI 正讓網路犯罪的規模、速度與複雜度,提升到前所未有的層級。
Thumbnail
網路安全的世界,正在進入一個由 AI 主導的新戰場。根據最新統計,2025 年全球由 AI 驅動的網路安全事件已激增 47%,這不再是未來式,而是現在進行式。從自動生成釣魚郵件到開發客製化勒索軟體,AI 正讓網路犯罪的規模、速度與複雜度,提升到前所未有的層級。
Thumbnail
這是一場修復文化與重建精神的儀式,觀眾不需要完全看懂《遊林驚夢:巧遇Hagay》,但你能感受心與土地團聚的渴望,也不急著在此處釐清或定義什麼,但你的在場感受,就是一條線索,關於如何找著自己的路徑、自己的聲音。
Thumbnail
這是一場修復文化與重建精神的儀式,觀眾不需要完全看懂《遊林驚夢:巧遇Hagay》,但你能感受心與土地團聚的渴望,也不急著在此處釐清或定義什麼,但你的在場感受,就是一條線索,關於如何找著自己的路徑、自己的聲音。
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News