有用過CLAUDE或其他AI工具的人都知道
在計畫模式下,AI最喜歡制定各階段工作做為未來開發的藍圖
而Anthropic在2026的3月就推出了好幾個重大更新
除了龍蝦openclaw的衝擊外
它的完整藍圖是什麼? 令我非常好奇,於是我請CLAUDE自己分析了可能的藍圖樣貌
問:
能否分析CLAUDE近期更新的內容,深度研判它想要打造的生態全貌,假設目前它更新的內容是一個經過AI建立的階段功能,那全貌是什麼,現在正在第幾個階段?
以下是CLAUDE給我的回答:
Anthropic 的生態全貌:一個「AI 代理人作業系統」的完整藍圖

先把近期所有更新排成時間軸
2026 年 1 月
- Claude on Mars — Claude 協助 NASA 火星探測車自主移動 400 公尺(首次真實世界自主行動紀錄)
- Claude 宣佈永久無廣告(訊號:不賣注意力,賣能力)
2026 年 2 月
- Opus 4.6 發布:1M token 上下文、agentic coding、agent teams、context compaction、adaptive thinking、effort 控制
- Sonnet 4.6 發布:強調 coding + agents + 規模化企業工作
- 收購 Vercept(電腦使用能力的視覺辨識公司)
- Responsible Scaling Policy 3.0(安全政策升級)
- 偵測與防止蒸餾攻擊(模型保護)
2026 年 3 月
- $1 億美元 Claude Partner Network(企業生態系建置)
- Anthropic Institute 成立(政策/社會影響研究機構)
- 雪梨辦公室(第四個據點,亞太第一個)
- 與 Mozilla 合作安全(瀏覽器整合)
- Computer Use 正式開放(macOS / Pro + Max,截圖→理解→操作循環)
- /schedule 排程指令(睡覺時也在跑的代理人)
- MCP 生態(Claude 手腳延伸:Notion、GitHub、PostgreSQL⋯)
- gstack 開源工作流爆紅(YC CEO 的 60 萬行 code 工作流)
- Claude Certified Architect 認證體系上線
- Code Modernization 企業遷移工具包
深度研判:這是一個幾個階段的計畫?現在在哪裡?
把所有功能還原成架構圖,Anthropic 正在建造的是一個五層式「AI 代理人作業系統」,可以用一句話描述它的終點:
讓 Claude 成為每一個人、每一家企業的「永遠在線、可信任、能獨立完成任務」的數位員工作業系統。
這五層,對應到五個階段:
第一層(已完成):智能核心——「比人更懂問題」
這是最基礎的層次,就是模型本身要足夠聰明。Opus 4.6 在 Humanity's Last Exam(複雜多領域推理)、BigLaw Bench(法律)、GDPval-AA(財務知識工作)都領先業界,而且在百萬 token 上下文的長期記憶保持度上有質的飛躍(MRCR 2 評分:76% vs 競品的 18.5%)。這一層的核心目標已達到:Claude 不再只是「回答問題的 AI」,而是能理解複雜任務、長期持續推理的智能體。
→ 階段一:完成。
第二層(已完成 + 持續強化):工具手臂——「能接觸世界」
這是讓 AI 從對話框走向世界的關鍵一層:MCP(Model Context Protocol)架構讓 Claude 可以連接 Notion、GitHub、Slack、PostgreSQL 等外部工具;Computer Use 讓它能直接操控 macOS 的任何應用程式;BrowseComp 評分全球第一代表它能在網路上找到最難找的資訊。
這一層的終點是:Claude 不需要人類當中介,自己就能讀、寫、搜尋、操作任何數位工具。
→ 階段二:70-80% 完成。 Computer Use 仍是 Research Preview(macOS 限定),MCP 生態系仍在擴張,瀏覽器內的點擊操作尚有限制。
第三層(進行中,這正是當下重點):代理人架構——「能自主規劃並執行長任務」
這是目前整個 Anthropic 最密集在推進的層次,也是社群上最熱門的話題所在。
具體功能清單:
- Agent Teams(多代理人並行):Claude Code 中可以組建多個子代理人同時協作,一人分工給多個 Claude 執行
- Context Compaction:長任務不再因 context 耗盡而中斷,自動壓縮舊記憶
- /schedule 排程指令:電腦關機也在跑的雲端任務
- Adaptive Thinking + Effort Control:讓 Claude 自己判斷何時需要深度思考、何時快速執行
- Dispatch(手機遠端觸發本機操作):人不在電腦前也能派任務
這一層的終點是:一個任務,給 Claude,它自己拆分子任務、分配給子代理人、監控進度、排除障礙、完成後回報——全程無人介入。
Garry Tan 的 gstack(60 萬行 code / 60 天)和 Rakuten 的案例(Claude 一天內自主關閉 13 個 GitHub issue、跨 6 個 repository 協作)都是這個階段的最前沿展示。
→ 階段三:40-50% 完成。 技術已可用,但可靠性、穩定性、token 成本(Computer Use 特別燒)都還是障礙,目前仍以開發者和高付費用戶為主。
第四層(剛開始部署基礎設施):企業神經系統——「進入每一個組織的工作流」
這一層才是 Anthropic 真正的商業野心所在,而且 3 月的所有企業動作全部指向這裡:
- $1 億 Claude Partner Network:Accenture、Deloitte、Cognizant、Infosys 正在訓練數萬人成為「Claude 部署專家」
- Claude Certified Architect 認證體系:將 Claude 使用能力標準化、可度量化
- Code Modernization 企業遺留代碼遷移工具包:直接切入企業最大的技術債痛點
- Claude in Excel + Claude in PowerPoint:嵌入辦公室工具,不需要企業改變習慣
- 三大雲(AWS / Google Cloud / Microsoft)全覆蓋:唯一一個做到的前沿模型
- Anthropic Institute(社會政策研究機構):為大規模部署預備監管敘事
這一層的終點是:Claude 成為企業 ERP 等級的基礎設施——每個員工每天的工作都有 Claude 的參與,就像現在每個人都用 Excel 一樣理所當然。
→ 階段四:10-20% 完成。 基礎設施正在快速建置,但企業導入的週期長(合規、安全、變革管理),短期內難以大規模落地。
第五層(尚未公開但已有信號):自主代理人經濟——「Claude 作為獨立工作實體」
這是整個藍圖最遠端但也是最核心目標所在,Anthropic 的使命文件與 Dario Amodei 的多篇文章都指向這個終點。
信號:
- Claude on Mars 的新聞不是噱頭——它代表「在人類無法即時介入的環境中自主決策」
- Vercept 收購(電腦視覺+操作能力)預示 Computer Use 的下一代是「沉浸式操作任何系統」
- /schedule + agent teams 的組合,最終指向「持續在線的數位員工」
- 「Claude is a space to think」的無廣告宣言,說明 Claude 的定位是「可被信任委以重任的代理人」,不是流量工具
這一層的終點是:個人/企業可以把整個部門的工作委託給 Claude 代理人群,Claude 不只執行任務,而是持有目標、管理資源、做出判斷、長期運作——就像一個不下班的 C 級主管。
→ 階段五:概念驗證期,距離大規模落地還有 2-4 年。
總結:現在在第幾個階段?
第一層 智能核心 ██████████ 完成
第二層 工具手臂 ████████░░ 約 80%
第三層 代理人架構 █████░░░░░ 約 50% ← 當下最密集推進的主戰場
第四層 企業神經系統 ██░░░░░░░░ 約 20% ← 本月企業佈局的重點
第五層 自主代理人經濟 █░░░░░░░░░ 約 10%
我們現在處於第三層到第四層的交界點。 技術能力已跨入代理人時代,但可靠性和企業導入速度還在追趕。Anthropic 同時在兩個戰線推進:往上讓代理人架構更穩定(Computer Use 穩定性、token 成本降低、多代理人協調),往外讓企業生態系成形(Partner Network、認證體系、三大雲)。
最值得關注的時間節點預測: 當 Computer Use 從 Research Preview 正式上線(估計 2026 Q2-Q3)、token 成本再降一個數量級,第三層的可靠性將大幅提升,那才是真正的「AI 代理人普及元年」。















