
我們賦予AI Agent四個能力:
- 大腦(大型語言模型 LLM)
- 思考
- 理解使用者的需求或問題
- 決定採取什麼行動
- 選擇使用什麼工具
- 回答詢問或報告結果
- 記憶
- 短期記憶 ⊙當前對話內容
- 長期記憶 ⊙認識使用者 ⊙知道使用者的偏好和習慣 ⊙從過去到現在的對話記錄 ⊙所學知識 ⊙所需資訊
- 工具(需要功能與使用說明書)
- 檔案處理(讀寫檔案)
- 電子郵件(收發訊息)
- 搜尋引擎(搜尋資料)
- 計算機 (計算數字)
- 其它
- 執行(串接整合的迴圈邏輯)
- 何時應該呼叫LLM
- 何時應該使用工具
- 何時應該回應或詢問使用者
上述形成AI Agent的4個核心零組件,我們可以依據需求或任務,組裝成完整的智能體。
AI Agent在思考時,就跟人一樣,會一直想,也會適可而止、不再想了。
所以,須設定條件,只要條件成立,AI就會停止思考,而不會一直在一個點上轉、鑽牛角尖,有了變通的空間。
這些條件是:
- 達到上限
- 完成任務
- 確定無法處理
- 需要人類介入
AI Agent:
- 接收任務
- 思考計畫
- 執行動作
- 評估結果
- 省思改善(如果達成,即結束並報告;如果沒達成,就繼續想方設法)
這樣,形成一個自主(自動化)迴圈循環。
在過程中,會遇到各種狀況,我必須學習處理:
- 輸入驗證-設定合理限制,不要讓AI處理太過龐大的檔案。
- 錯誤處理-如果執行失敗或錯誤,AI須回報明確的失敗或錯誤訊息。
- 異常處理
- 安全管理-將應用程式金鑰(API Key)儲存在環境變數(設定),不要寫在程式中。
- 風險控管-AI遇到重大決策、敏感操作或超出權限時,須停下來詢問人。
- 記錄追蹤-將每次執行記錄下來,出問題時可以回溯。
經過不斷改進,AI Agent愈趨安全穩定。
我們理解AI的思考與行動模式,就能設定合理務實的期望和目標,更好地與AI協作,提供良好的回饋,相互從反饋中逐步改善進益。




















