最近和一位印度工程師 R 的對話,表面上看是 Claude 使用方式的理解落差,但往深處看,真正浮現的不是工具操作問題,而是認知框架(mental model) 的差異。
McKinsey 2024 年的調查顯示,雖然九成員工已在某種程度上使用生成式 AI,但高層主管估計只有 4% 的員工真正將 AI 用於 30% 以上的日常工作。工具普及與真正改變工作方式之間,存在一道巨大的鴻溝。
當一位工程師還在用舊框架理解 AI Agent 時,如果回覆方式也繼續停留在舊框架,那對他的未來幾乎沒有幫助;只有用新框架回覆,才可能留下一絲真正改變的機會。
事情的起點:一個很具體的存檔錯誤
R 在處理 database dump 時,把要輸出的 .sql 檔案指向了一個錯誤的路徑,並傳來截圖,表示系統提示需要 root permission 才能存檔。他展示截圖的潛台詞是:自己是照著 Claude 的步驟去做的。
問題其實更基本:檔案要被存入的不是使用者的 home 目錄,而是一般使用者本來就沒有寫入權限的位置。
這暴露出一種常見的早期 AI 使用者心態:把 AI 當成權威步驟來源,照做之後若出現阻礙,就傾向先證明自己有照做,而不是先回頭檢查任務定義是否合理。
介面差異不是問題所在
R 回覆的重點落在:這個截圖是 Claude Code CLI 的畫面、他自己的截圖是 VS Code Claude、所以兩者不同。
但真正的重點根本不在介面。我想表達的核心是:就算介面不同,Claude 的本質使用模式其實是一樣的。
真正的差異不是 UI,而是你把 Claude 當成什麼:
- 如果把 Claude 當成 chatbot,你會一直問:「How do I do this?」
- 如果把 Claude 當成 executor,你會直接說:「Dump the database to SQL and move it to my Downloads folder.」
表面上只差一句英文,實際上背後是整個工作邏輯的切換。
那句話,暴露的不是對錯,而是思維慣性
R 後來問了一句很值得分析的話:
So both me and the screenshot I sent are wrong, right?
這句話真正暴露的是三件事。
他在尋找二元判決。 他想把整件事簡化為「我是對的」或「我是錯的」,下意識把複雜問題壓縮成最容易求解的是非題。
他還在用舊工具時代的提問方式。 在 agent world,問題不再是「步驟是什麼」,而是:任務是否清楚?邊界是否清楚?結果是否可驗證?
他在要求別人替他完成思考。 真正更高解析度的問法應該是:「So the problem is not Claude Code CLI vs VS Code, but whether I’m treating Claude like an executor. Correct?」這種問法是在驗證自己已經形成的理解,而不是在討判決。
為什麼回「What do you think yourself?」
當 R 這樣問時,我回的是:
What do you think yourself?
這句回覆的目的不是逃避,而是拒絕強化舊認知模式。
新框架回覆的目的不是立刻給答案,而是改變對方產生答案的方式:
Wrong way: “How do I dump the database to SQL?”
Right way: “Dump the database to SQL and move it to my Downloads folder.”
這不是單純在修 prompt wording,而是在教一個全新的工作模式。
如果你也在帶這樣的工程師,可以怎麼做
停止幫他回答「how」,改問「你想達到什麼結果」。 把問題反回去:「你最後要拿到什麼?」這會強迫對方重新定義任務,而不是停在工具操作層。
用具體的 before/after 指令對比,而不是理論說明。
- 舊:「如何問句開頭」這時候你會變成 AI agent 的下手
- 新:「目標、行動、預期成果」這時候 AI agent 會變成你的手下
讓對方自己看到差異,比講 30 分鐘理論有效。
觀察他遇到錯誤時第一個問題是什麼。 如果第一個問題是「是不是工具的問題」,代表他還在表層。如果第一個問題是「我的任務定義是不是有問題」,代表他開始進入 agent 思維。
不要急著幫他解決問題,給他 10 分鐘自己先想。 刻意製造一點「不舒服的沉默」,讓他先嘗試自己分解問題,往往比直接回答更有長期效果。
珠算與 Excel:認知介面的切換問題
一個習慣打算盤珠算的人,第一次拿到 Excel,可能會先問:珠子在哪邊?
這句話點出了新工具 adoption 最常見的障礙:人們不是看不懂功能,而是先去找舊世界熟悉的零件。把 AI 當搜尋框的人找「how」——這不是愚蠢或保守,而是認知介面(cognitive interface) 還沒有切換。
Stack Overflow 2024 年對超過六萬名開發者的調查顯示,76% 正在使用或計劃使用 AI 開發工具,但同一份調查裡,只有 43% 的人對 AI 輸出的準確性表示有信心。工具採用率在快速上升,但真正建立起協作思維的人,仍是少數。
加入公司背景,這段對話的重量完全不一樣
公司已經把印度開發團隊人數削減到只剩原本的五分之一,而 R 是剩下的少數成員之一。
GitHub 2024 年的研究發現,使用 AI coding assistant 的工程師,任務完成時間從平均 2 小時 41 分縮短至 1 小時 11 分——前提是他們知道如何把任務清楚地交給 AI。工具的槓桿效果,取決於使用者有沒有完成思維切換。
當團隊被砍到只剩 1/5,管理者不只是看誰今天能不能交付,而是看誰未來能不能在更少人力下與 AI 一起放大產出。
結論:認知的改變,才能真正驅動 AI Agent
認知的改變,才能真正驅動 AI Agent。
如果還是用舊世界的方法回應新世界工具,那麼未來很可能只是舊效率的延長。只有當人願意放下舊珠子,接受整個桌面都已經變成新的算盤,AI Agent 才會真正開始工作。
而對已經被保留下來的少數工程師來說,這不只是學習問題。它是一個更現實的問題:在 AI 已經可以完成大量執行工作的時代,人的價值在哪裡?
答案不在於你會不會用工具,而在於你有沒有能力成為那個給工具方向、定義任務、驗證結果的人。這個角色,才是 AI Agent 時代真正難以被取代的位置。
歡迎至原文閱讀完整版本與後續更新
https://blog.stanwu.org/posts/ai-agent-mental-model-shift/














