大家都在說要導入 AI Agent,但在金融業推這件事的人,大概都有一個共同的感受:沒那麼簡單。
這一兩年,Agentic AI 是業界最熱的話題之一。自主編排、多代理協作、像員工一樣工作等這些描述聽起來很誘人,也讓很多金融業的主管開始問:「我們什麼時候可以導入?」
我們不是要否定 Agentic AI 的價值。這個技術確實有它真正厲害的地方,在某些場景下也確實能發揮作用。但在金融業實際推過這件事之後,我發現大家的期待和現實之間,存在幾個很具體的落差。
這篇想從「導入前、導入中、導入後」三個階段,把這些落差說清楚。不是要讓你打退堂鼓,而是希望在你開始之前,期待能設得務實一點。
導入前:你的系統架構,準備好迎接 Agent 了嗎?
Agentic AI 最吸引人的想像之一,是它可以「像員工一樣」操作系統、調用工具、完成任務。但這個想像成立的前提,是 Agent 能夠實際接觸到這些系統和資料。
在金融業,這件事比想像中複雜得多。
第一個現實是資料安全和個資法規。 Agent 要做判斷,就需要資料。但金融業處理的是顧客的帳務資訊、保單資料、信用記錄等等,這些資料能不能送給雲端的 AI 模型?送出去之前需要經過哪些脫敏處理?有沒有違反金管會的相關規範?這些問題在討論「要不要導入 Agent」的時候,幾乎都還沒有被認真回答。
第二個現實是 RPA 的架構問題。 很多人期待 Agent 能串接現有的 RPA 流程,讓自動化更進一步。但金融業的 RPA 大多跑在本機或內部網路,不是雲端服務,Agent 可能根本沒辦法直接呼叫它。要解決這個問題,就需要把 RPA 上雲,但這又牽涉到 IT 架構調整、資安審查、法規合規,不是幾個月內能解決的事。
第三個現實是工作型態的改變,而不是工作的消失。很多人導入 AI 的期待是「之後員工可以少做很多事」,但在前期,BU 要花大量時間做 Golden Dataset 的標註、對齊判斷標準、處理邊緣案例,這些工作在傳統開發裡根本不存在。AI 不是讓工作消失,而是讓工作的型態改變。短期內,人力投入甚至可能比以前更多。
務實的做法:在決定導入 Agent 之前,先做兩件事。第一,盤點資料流,哪些資料會被 Agent 接觸到、敏感程度如何、現有系統架構能不能支撐。第二,跟 BU 說清楚前期的人力投入,Golden Dataset 的標註、判斷標準的對齊等等,這些都需要業務端實際參與,不是技術團隊自己能搞定的。期待管理做好,後續的合作會順很多。
導入中:金融業的合規要求,和 Agent 的運作邏輯天生衝突
Agentic AI 的核心特色之一,是它能夠「自主編排」,根據目標自己決定要採取什麼行動、調用什麼工具、走什麼路徑。這個特性在很多場景下很有價值,但在金融業,它和合規要求之間存在一個根本性的矛盾。
金融業需要審計軌跡。 每一個業務決策都需要可追溯、可解釋,為什麼這筆交易被核准?為什麼這個保單被歸類為高風險?如果 Agent 自主決定了路徑,但我們沒辦法回溯它為什麼這樣做,這在合規上是有問題的。
除此之外,金融業的很多業務邏輯是基於法規和精算的硬規則。AI 擅長處理語義模糊的判斷,但不擅長在複雜的商業規則中自行導航而不出錯。硬要讓 Agent 自主處理這些邏輯,出錯的風險遠高於人工處理。
所以在金融業,真正能落地的往往不是「完全自主的 Agent」,而是一個更受控的版本—讓 AI 在我們定義好的商業流程中,負責處理語義理解和模糊判斷的部分,邊界之外的決策還是由人來把關。
務實的做法: 與其追求「自主編排」,不如先定義清楚 Agent 的活動範圍,哪些決策可以由 AI 自動處理、哪些必須觸發人工複核。這個邊界設計清楚了,Agent 才能在金融業的合規框架內真正發揮價值。
導入後:上線不是終點,而是另一個開始
傳統程式開發有一個很直觀的特性:上線之後,除非有 bug 或新的業務需求,系統基本上會按照你寫的邏輯穩定運作。但 AI 模型不是這樣。
現有的上線檢核機制,幾乎都是為傳統程式設計的。 上線審查會議裡,大家習慣檢查的是系統回應時間、錯誤率、穩定度等,這些對傳統程式來說是合理的指標。但拿來評估 AI 模型,根本測不到真正重要的東西。
AI 模型需要被評估的是完全不同的一套指標:整體準確率分佈是否達標、信心分數門檻設定是否合理、邊緣案例的表現是否在可接受範圍內、不同類別之間的準確率是否均衡。這些指標不在現有的檢核清單裡,而且大多數組織目前也還沒有人知道應該怎麼設計這份清單或是還在嘗試設計清單。結果就是用舊的標準驗收新的技術,通過了檢核,但上線之後才發現問題。
更大的問題是上線之後的維運。AI 模型會隨著時間產生性能衰退:資料分佈改變、業務情境更新、模型本身的迭代,這些都會影響模型的表現。 如果沒有建立監控機制和回饋迴路,你可能要等到業務單位反映「AI 最近判斷都怪怪的」,才發現模型早就出問題了。
務實的做法: 在規劃 Agent 專案的時候,把監控和維運機制納入範疇,而不是上線之後再想。同時,在專案初期就開始討論 AI 專屬的上線檢核標準,準確率門檻是多少、信心分數怎麼設、邊緣案例怎麼驗收,讓這些指標在上線審查時有依據可以對照。
那 Agentic AI 在金融業到底有沒有未來?
有。但不是現在很多人想像的那個樣子。
Agentic AI 真正厲害的地方,是它能夠理解語義、處理非結構化資料、在模糊的情境中做出判斷,這些是傳統程式和 RPA 做不到的。在金融業,這類場景確實存在,也確實值得投入。
但「AI Agent 可以像員工一樣自主工作」這個想像,在金融業的合規框架、資料安全要求、和系統架構限制下,短期內很難實現。與其追求一個完全自主的數位員工,不如把目標設定在「讓 AI 在定義好的範圍內,把人做不好或做不完的語義判斷工作處理好」,這個目標更務實,也更容易創造真實的價值。

期待設得太高,專案很容易在落差中失敗。期待設得務實,才有機會一步一步把 AI 真正導入金融業的日常運作。
下一篇回到實務框架,聊聊 AI 成本怎麼控管,當你決定要導入 AI 之後,如何透過層次化的模型架構設計,在準確率和成本之間找到務實的平衡點。

























