用弱模型管強模型？跑了半年 AI 團隊，我發現客戶在乎的根本不是這件事

水電工阿水

發佈於AI 協作實戰

2026/04/15 更新2026/04/15 發佈閱讀 6 分鐘

最近 AI 圈有一個很熱的討論。

哥倫比亞大學發了一篇論文，研究 AI Agent 管線裡「誰當規劃者、誰當執行者」的最佳組合。結果非常反直覺——用最強的模型當規劃者，表現反而最差。準確率差了四十幾個百分點。

原因是，那個強模型「太聰明」了，聰明到覺得自己直接回答就好，根本不需要把任務交給執行者去做。它跳過了整個流程。

很多人看到這個結論，馬上推導出一套新的最佳實踐：用弱模型當主管，強模型當手腳。弱模型因為能力不足，反而會乖乖拆解問題、委派任務。

這個發現本身是真的。但我想從另一個角度聊聊——因為我剛好在做一件類似的事。

我用一個人加六個 AI，跑一間公司。跑了超過半年。踩過的坑，可能比論文的實驗組還多。

模型不聽話，是因為你沒寫好規矩

先回到那個論文的場景。

那個實驗的架構很簡單：規劃者負責拆問題，執行者負責查資料回答。強模型當規劃者時，直接跳過執行者自己答了。所以研究者的結論是——規劃者的位置應該放弱模型。

但我想問一個問題：實驗裡有沒有明確告訴那個強模型「你不准自己回答」？

如果沒有，那問題不在模型太聰明，而在指令沒寫清楚。

我的團隊裡也有強模型在做規劃和分析。它會不會想要自己直接動手？會。但它不會真的跳過流程，因為我的系統裡有白紙黑字的角色定義：你負責分析和拆解，執行是另一個角色的事，你的產出是任務指令，不是最終成品。

弱模型的「乖巧」不是因為它懂得委派，是因為它沒有能力不乖。 這不是管理，這是碰運氣。真正的管理是——就算它有能力跳過流程，制度也能讓它不跳。

我踩過的坑：跳過流程的不是 AI，是我自己

說一個真實案例。

我們團隊的標準工作流程是這樣的：我先出任務卡，技術總指揮分析後產出書面的任務指令檔，監督角色拆解任務交給開發者執行，執行完畢監督角色驗收，最後回報給我做最終確認。每一層都有明確的輸入和輸出，每一步都留紀錄。

有一次，我趕著出門處理事情，心想這個任務不複雜，就跳過了任務卡和指令檔的環節，直接讓監督角色在同一個工作頁面即時指揮開發者做事。

結果？工作上下文太長，系統直接崩掉了。開發者做到一半，整個脈絡斷裂，產出的東西完全偏離方向。更慘的是，因為過程沒有留下獨立的任務紀錄，事後要 debug 連問題出在哪一步都查不出來。

最後，我花了比正常流程多好幾倍的時間，才把事情修回來。

那次之後我學到一件事——流程不是用來拖慢速度的，是用來確保你不用回頭重走的。

而且你注意到了嗎？這次跳過流程的不是 AI「太聰明」，是我這個人類 PM 自己貪快。

所以當我看到那篇論文說「強模型太聰明會跳過流程」的時候，我的反應是：那你的流程設計本身就有漏洞。 不管是人還是 AI，只要制度沒有把邊界寫清楚，就一定會有人（或有 AI）走捷徑。解法不是找一個「剛好不夠聰明」的來做事，而是把制度建好。

但說到底——你的客戶在乎這些嗎？

這是我最想講的一件事。

整個 AI 技術圈花大量時間在討論：模型評測、架構設計、Planner 該用 Opus 還是 Haiku、Agent 管線怎麼跑最有效率。這些當然重要，這是技術人的專業。

但你去問一個開美容院的老闆：「我幫你做系統，用的是 Opus 當規劃者還是 Haiku 當規劃者？」

她會看你像看外星人。

她在乎的是什麼？客人能不能順利預約、系統會不會出錯讓她丟客人、一個月花多少錢、出問題的時候多快能修好。

你用什麼模型、什麼架構，對她來說就像你問一個吃牛肉麵的客人：「我們的麵條是用 12 號壓麵機還是 14 號壓出來的？」

她只在乎好不好吃。

我在水電領域做了三十年。三十年來，從來沒有一個客戶問我用什麼牌子的扳手、什麼型號的電表。他們只問三件事：會不會漏水、保固多久、多少錢。

AI 服務也是一模一樣的道理。

技術圈正在發生一個危險的趨勢：我們太專注於「怎麼做」，而忘了問「為誰做」。我們在模型選擇上精益求精，卻沒有花同樣的心力去理解客戶的真實需求。

這不是說技術不重要。技術當然重要，它是你的專業底氣。但技術是你的事，讓客戶感覺不到技術的存在，才是你的本事。

三個我從實戰中學到的事

如果你也在用 AI 建立工作流程，或者你想用 AI 來服務客戶，這三件事是我用半年多的時間換來的：

第一，先寫規矩再選模型。 角色邊界、任務格式、禁止行為、驗收標準——這些東西要先定義清楚，再來決定每個位置用什麼模型。順序反了，你會不斷換模型，但問題永遠存在。

第二，分層驗收比分層模型有效。 與其糾結規劃者用什麼模型、執行者用什麼模型，不如設計一個驗收機制，確保每一步的產出符合預期。出了問題，你馬上知道是哪一層出的，不用整條管線從頭查。

第三，永遠記得你在為誰做事。 模型會升級、框架會過時、今天的最佳實踐明天可能被推翻。但客戶的需求不會變——他們要的是穩定、可靠、解決問題。你的架構設計最終要服務這件事，不是服務技術圈的審美。

寫在最後

我不是學術研究者，我寫不出論文。我是一個在水電領域做了三十年、現在帶著六個 AI 跑公司的人。

這些觀點不一定對，但它們是真金白銀換來的——每一個踩過的坑，都花了時間和成本去修。

如果你正在這條路上，希望這些經驗能讓你少走一些彎路。

技術的世界變化很快，但有些道理很慢——做事要有規矩，做人要記得客戶。

這兩件事，不管 AI 怎麼進化，大概都不會變。

水電工阿水｜SoloAI AI 數位轉型顧問 LINE：@368utzqf　　soloai885.com

含 AI 應用內容

水電工阿水的 AI 轉型日誌AI 協作實戰

留言

水電工阿水的 AI 轉型日誌

0會員

17內容數

我是「水電工阿水」——本名顏建明。從實體水電做了二十年，後來轉去做了十年熱水器網路銷售，這三十年都在水電這個領域。現在的我用 AI 經營一間數位服務公司，記錄我從傳統技工轉型為 AI 顧問的真實過程——包括我用的工具、踩過的坑、以及那些讓工作效率翻倍的實戰 SOP。如果你也想用 AI 改變現狀，歡迎一起。

水電工阿水的 AI 轉型日誌的其他內容

2026/04/14

每次開新對話，我就是在叫醒一個失憶的員工

我六個 AI 員工。每次開工，得先把文件貼給他們看——因為他們不記得昨天。 AI 沒有跨對話的記憶。六個月下來我得出一個結論：AI 協作的瓶頸不是模型不夠強，是記憶系統沒設計好。上週讀到好萊塢女星做的開源記憶系統，上線兩天 GitHub 破兩萬三千顆星。這篇寫我從中看到什麼，以及下一步打算怎麼做。

2026/04/14

每次開新對話，我就是在叫醒一個失憶的員工

2026/04/04

二十年前我在電子商務犯過的錯，今天整個 AI 產業正在重演

2005年台灣電商起飛時，懂技術的不懂商務、懂商務的不懂技術，中間缺翻譯者。二十年後的AI產業正在重演同樣劇本。技術派追模型追框架，商家砸錢做AI卻沒人用。真正稀缺的不是會用AI的人，而是能把AI翻譯成商業價值的人。先找商業模式，再談技術。

2026/04/04

二十年前我在電子商務犯過的錯，今天整個 AI 產業正在重演

2026/03/31

我讓 AI 監工自己去寫程式，結果整條產線炸了

我讓 AI 監工跳過流程直接寫程式，一張 97 bytes 的壞圖炸掉整個對話，五張任務卡遺失、四項決策指令全部消失。但按正規流程做的檔案一個都沒少。這次踩坑讓我學到：AI 團隊的分工邊界是物理隔離，不能靈活補位；流程裡看似多餘的人工中轉，其實是品質關卡。一人公司用 AI 協作的真實教訓。

2026/03/31

我讓 AI 監工自己去寫程式，結果整條產線炸了

看更多

你可能也想看

湯編驛-湯姆實驗室

GPT-5遊戲開發實戰：從簡陋塔防到中世紀風格，AI助你輕鬆創作遊戲原型

這篇文章分享了作者使用GPT-5開發塔防遊戲的經驗，從一句話生成遊戲到逐步優化畫面、加入裝備系統，以及過程中遇到的錯誤和解決方法。作者強調AI開發的迭代過程和關鍵字的重要性，並分享了應對AI理解偏差和重複錯誤的技巧。文章也提及了AI在遊戲開發中的優缺點，以及如何更好地利用AI進行遊戲原型設計。

#GPT-5#遊戲#前端開發

2025/08/15

湯編驛-湯姆實驗室

GPT-5遊戲開發實戰：從簡陋塔防到中世紀風格，AI助你輕鬆創作遊戲原型

#GPT-5#遊戲#前端開發

2025/08/15

詹育杰的沙龍

《轉轉生 Re:INCARNATION》：Qudus Onikeku、約魯巴哲學與 Afrobeat 的去殖民身體政治

《轉轉生》（Re:INCARNATION）為奈及利亞編舞家庫德斯．奧尼奎庫與 Q 舞團創作的當代舞蹈作品，結合拉各斯街頭節奏、Afrobeat／Afrobeats、以及約魯巴宇宙觀的非線性時間，建構出關於輪迴的「誕生—死亡—重生」儀式結構。本文將從約魯巴哲學概念出發，解析其去殖民的身體政治。

#2026北藝嚴選#北藝嚴選#臺北表演藝術中心

2026/02/05

詹育杰的沙龍

《轉轉生 Re:INCARNATION》：Qudus Onikeku、約魯巴哲學與 Afrobeat 的去殖民身體政治

#2026北藝嚴選#北藝嚴選#臺北表演藝術中心

2026/02/05

釀電影，啜一口電影的美好。

性別之外，存在面前──淺談劇作《遊林驚夢：巧遇 Hagay》

這是一場修復文化與重建精神的儀式，觀眾不需要完全看懂《遊林驚夢：巧遇Hagay》，但你能感受心與土地團聚的渴望，也不急著在此處釐清或定義什麼，但你的在場感受，就是一條線索，關於如何找著自己的路徑、自己的聲音。

#2026北藝嚴選#北藝嚴選#臺北表演藝術中心

2026/03/02

釀電影，啜一口電影的美好。

性別之外，存在面前──淺談劇作《遊林驚夢：巧遇 Hagay》

#2026北藝嚴選#北藝嚴選#臺北表演藝術中心

2026/03/02

湯編驛-湯姆實驗室

GPT-5 遊戲開發實戰：從薩爾達到吸血鬼倖存者，AI 讓遊戲創作觸手可及

使用GPT-5 開發遊戲的親身體驗分享，從薩爾達風格遊戲到吸血鬼倖存者風格遊戲的轉換過程，並探討AI在遊戲開發領域的可能性與對軟體工程師工作的影響。

#軟體開發#玩家#薩爾達傳說

2025/08/10

湯編驛-湯姆實驗室

GPT-5 遊戲開發實戰：從薩爾達到吸血鬼倖存者，AI 讓遊戲創作觸手可及

#軟體開發#玩家#薩爾達傳說

2025/08/10

陳沅綦的沙龍

柏林劇團《三便士歌劇》：巴里．柯斯基的經典再造，與布萊希特劇場的當代轉向

本文分析導演巴里・柯斯基（Barrie Kosky）如何運用極簡的舞臺配置，將布萊希特（Bertolt Brecht）的「疏離效果」轉化為視覺奇觀與黑色幽默，探討《三便士歌劇》在當代劇場中的新詮釋，並藉由舞臺、燈光、服裝、音樂等多方面，分析該作如何在保留批判核心的同時，觸及觀眾的觀看位置與人性幽微。

#2026北藝嚴選#北藝嚴選#臺北表演藝術中心

2026/02/11

陳沅綦的沙龍

柏林劇團《三便士歌劇》：巴里．柯斯基的經典再造，與布萊希特劇場的當代轉向

#2026北藝嚴選#北藝嚴選#臺北表演藝術中心

2026/02/11

Patrick.Wong的沙龍

用AI內容檢測工具檢測自己文章的AI化程度

用AI檢測器檢測自己文章的AI化程度：沒有AI協作的文章被檢測有AI生成的成分，這結果我也是驚了個呆！

#AI#生成式AI#AI創作

2025/10/26

Patrick.Wong的沙龍

用AI內容檢測工具檢測自己文章的AI化程度

用AI檢測器檢測自己文章的AI化程度：沒有AI協作的文章被檢測有AI生成的成分，這結果我也是驚了個呆！

#AI#生成式AI#AI創作

2025/10/26

沒什麼人味的訪談室

不再只是讀 PDF！解鎖 NotebookLM「研究夥伴」模式：用研究七步法打造你的 AI 智庫

本文介紹如何利用 NotebookLM 的隱藏版指令，將其從單純的 PDF 閱讀器，進化為強大的深度研究夥伴。透過「研究指令包」與「SLR 系統性文獻綜述法」，可大幅縮短研究時間，並能在事實調查、邏輯辯證、資料驗證等階段，更有效率地產出高品質研究成果。文末提供實例與指令對照表，鼓勵使用者發揮創意..

#AI實戰心得#NotebookLM#AI研究方法

2026/01/18