最近 AI 圈有一個很熱的討論。
哥倫比亞大學發了一篇論文,研究 AI Agent 管線裡「誰當規劃者、誰當執行者」的最佳組合。結果非常反直覺——用最強的模型當規劃者,表現反而最差。準確率差了四十幾個百分點。
原因是,那個強模型「太聰明」了,聰明到覺得自己直接回答就好,根本不需要把任務交給執行者去做。它跳過了整個流程。
很多人看到這個結論,馬上推導出一套新的最佳實踐:用弱模型當主管,強模型當手腳。弱模型因為能力不足,反而會乖乖拆解問題、委派任務。
這個發現本身是真的。但我想從另一個角度聊聊——因為我剛好在做一件類似的事。
我用一個人加六個 AI,跑一間公司。跑了超過半年。踩過的坑,可能比論文的實驗組還多。
模型不聽話,是因為你沒寫好規矩
先回到那個論文的場景。
那個實驗的架構很簡單:規劃者負責拆問題,執行者負責查資料回答。強模型當規劃者時,直接跳過執行者自己答了。所以研究者的結論是——規劃者的位置應該放弱模型。
但我想問一個問題:實驗裡有沒有明確告訴那個強模型「你不准自己回答」?
如果沒有,那問題不在模型太聰明,而在指令沒寫清楚。
我的團隊裡也有強模型在做規劃和分析。它會不會想要自己直接動手?會。但它不會真的跳過流程,因為我的系統裡有白紙黑字的角色定義:你負責分析和拆解,執行是另一個角色的事,你的產出是任務指令,不是最終成品。
弱模型的「乖巧」不是因為它懂得委派,是因為它沒有能力不乖。 這不是管理,這是碰運氣。真正的管理是——就算它有能力跳過流程,制度也能讓它不跳。
我踩過的坑:跳過流程的不是 AI,是我自己
說一個真實案例。
我們團隊的標準工作流程是這樣的:我先出任務卡,技術總指揮分析後產出書面的任務指令檔,監督角色拆解任務交給開發者執行,執行完畢監督角色驗收,最後回報給我做最終確認。每一層都有明確的輸入和輸出,每一步都留紀錄。
有一次,我趕著出門處理事情,心想這個任務不複雜,就跳過了任務卡和指令檔的環節,直接讓監督角色在同一個工作頁面即時指揮開發者做事。
結果?工作上下文太長,系統直接崩掉了。開發者做到一半,整個脈絡斷裂,產出的東西完全偏離方向。更慘的是,因為過程沒有留下獨立的任務紀錄,事後要 debug 連問題出在哪一步都查不出來。
最後,我花了比正常流程多好幾倍的時間,才把事情修回來。
那次之後我學到一件事——流程不是用來拖慢速度的,是用來確保你不用回頭重走的。
而且你注意到了嗎?這次跳過流程的不是 AI「太聰明」,是我這個人類 PM 自己貪快。
所以當我看到那篇論文說「強模型太聰明會跳過流程」的時候,我的反應是:那你的流程設計本身就有漏洞。 不管是人還是 AI,只要制度沒有把邊界寫清楚,就一定會有人(或有 AI)走捷徑。解法不是找一個「剛好不夠聰明」的來做事,而是把制度建好。
但說到底——你的客戶在乎這些嗎?
這是我最想講的一件事。
整個 AI 技術圈花大量時間在討論:模型評測、架構設計、Planner 該用 Opus 還是 Haiku、Agent 管線怎麼跑最有效率。這些當然重要,這是技術人的專業。
但你去問一個開美容院的老闆:「我幫你做系統,用的是 Opus 當規劃者還是 Haiku 當規劃者?」
她會看你像看外星人。
她在乎的是什麼?客人能不能順利預約、系統會不會出錯讓她丟客人、一個月花多少錢、出問題的時候多快能修好。
你用什麼模型、什麼架構,對她來說就像你問一個吃牛肉麵的客人:「我們的麵條是用 12 號壓麵機還是 14 號壓出來的?」
她只在乎好不好吃。
我在水電領域做了三十年。三十年來,從來沒有一個客戶問我用什麼牌子的扳手、什麼型號的電表。他們只問三件事:會不會漏水、保固多久、多少錢。
AI 服務也是一模一樣的道理。
技術圈正在發生一個危險的趨勢:我們太專注於「怎麼做」,而忘了問「為誰做」。我們在模型選擇上精益求精,卻沒有花同樣的心力去理解客戶的真實需求。
這不是說技術不重要。技術當然重要,它是你的專業底氣。但技術是你的事,讓客戶感覺不到技術的存在,才是你的本事。
三個我從實戰中學到的事
如果你也在用 AI 建立工作流程,或者你想用 AI 來服務客戶,這三件事是我用半年多的時間換來的:
第一,先寫規矩再選模型。 角色邊界、任務格式、禁止行為、驗收標準——這些東西要先定義清楚,再來決定每個位置用什麼模型。順序反了,你會不斷換模型,但問題永遠存在。
第二,分層驗收比分層模型有效。 與其糾結規劃者用什麼模型、執行者用什麼模型,不如設計一個驗收機制,確保每一步的產出符合預期。出了問題,你馬上知道是哪一層出的,不用整條管線從頭查。
第三,永遠記得你在為誰做事。 模型會升級、框架會過時、今天的最佳實踐明天可能被推翻。但客戶的需求不會變——他們要的是穩定、可靠、解決問題。你的架構設計最終要服務這件事,不是服務技術圈的審美。
寫在最後
我不是學術研究者,我寫不出論文。我是一個在水電領域做了三十年、現在帶著六個 AI 跑公司的人。
這些觀點不一定對,但它們是真金白銀換來的——每一個踩過的坑,都花了時間和成本去修。
如果你正在這條路上,希望這些經驗能讓你少走一些彎路。
技術的世界變化很快,但有些道理很慢——做事要有規矩,做人要記得客戶。
這兩件事,不管 AI 怎麼進化,大概都不會變。
水電工阿水|SoloAI AI 數位轉型顧問 LINE:@368utzqf soloai885.com























