前兩個月我看到 Anthropic 設計主管 Jenny Wen 講「設計流程死了」(the design process is dead)的時候,我第一個反應是好奇:為什麼要講這麼引起爭議的話?
每次 AI 有新發展,外行人開開心心地說:我們不再需要設計師了。總是馬上引起設計圈內人的反擊。現在居然是 AI 公司的人自己跑出來說,設計流程已死。
講這麼爭議的話還不只 Jenny 一個人。這一年來,Anthropic 公司不同職位的人輪流在 Lenny's Podcast(矽谷最具影響力的產品 podcast)受訪。每一個都帶著自己的職位跟具體話題:
設計主管 Jenny Wen:「設計流程死了」 產品主管 Cat Wu:「PM 不寫 PRD,改寫 evals」 工程師 Boris Cherny:「11 月之後我沒手寫過一行程式碼,產能翻 3 倍」 成長主管 Amol Avasare:「70% 資源押在 Big test」
每段都像在炫技,但仔細想,他們在做同一件事:把「我怎麼工作、我用什麼標準判斷好壞」,講成一個可以被業界學、被讀者抄的東西。
這件事本身就很不尋常。AI 公司的對外曝光,通常是執行長、共同創辦人,頂多是一兩個明星高管。OpenAI 的首席研究長 Mark Chen(DALL-E 和 Codex 都是他帶的,台灣人很熟悉這個名字)也很少做這種深度的工作方法論訪談。OpenAI 高管的曝光,幾乎都是圍繞新產品發布或競爭事件,不是「我們公司怎麼想事情」。
Anthropic 做的是另一件事:把整間公司的工作方法,當成對外的品牌資產。
這讓我很想挖更多。於是我一口氣翻了 8 家一線 AI 公司的受訪素材、官方部落格、GitHub 文件,美國跟中國都翻了。翻完之後,我注意到五件事。這篇先講前兩件。
第一件:把工作方法做成資產,是沒有入口紅利的公司唯一的路
這是品牌策略,不是分享文化。
Google 有搜尋入口、Microsoft 有 Office 通路、Meta 有 FB 跟 IG。Anthropic 沒有這些,你甚至想不起來他們創辦人叫什麼名字(7 個從 OpenAI 出走的員工,其中兩個是雙 D 兄妹 Dario 和 Daniela Amodei)。當你沒有通路、創辦人光環也還沒有跨出業界小圈圈的時候,把工作方法做成別人想學的東西,是一條慢但走得遠的路。
DeepSeek 走的是同一個邏輯,但用不同貨幣:不發受訪、不辦大會,整家公司的對外資產是論文、開源代碼、乾淨的 API 文件。Anthropic 用「我們怎麼想」建立信任,DeepSeek 用「我們怎麼做」建立信任。兩家都在做同一件事的兩種表達。
我自己拿到的問題是:我工作裡有什麼判斷力,是只有我會做、但說不清楚的?把它說清楚的過程,就是 craft 的累積。craft 累積到一個程度,會變成你的競爭優勢。但 craft 如果只留在你身上,它也會變成你的天花板。
第二件:PM 不寫 PRD 之後,改在做什麼?
evals 是 evaluations 的縮寫,中文叫「AI 評估指標」。
白話版是這樣:你以前覺得「這份報告寫得好不好」是個感覺。現在你要把這個感覺,拆成「有沒有提到核心 KPI」「有沒有給可執行的下一步」「有沒有用對的時間範圍」這幾個可以一個一個打勾的問題。然後讓 AI 跑一百次,看一百次裡有幾次通過。這個通過率,就是這個 AI 在這個任務上的表現。
OpenAI 的產品長 Kevin Weil 說,寫 evals 會變成 PM 的核心技能,就像給模型的單元測試。Anthropic 的 Cat Wu 說,他們的 PM 不寫 PRD,改寫 evals。這個概念從少數公司的內部術語,在一年內變成整個 AI 產業共用的工作語言,甚至還有人開了線上課程在教。
對非工程師來說,evals 思維的入門不需要寫程式,只需要問自己三個問題:
我做這份東西的時候,腦子裡在打勾哪幾件事? 這幾件事,別人能不能照著打勾? 這個月的十份產出,幾份過了我自己的標準?
craft 是「我能做得更好」,evals 是「我能說清楚為什麼這個比那個好」。前者是個人能力,後者是可以傳承的團隊標準。
📌 本文首發於「許幼如|用數據拆解商業世界」,完整的 8 家公司分析請見: https://yojuhsu.com/blog/ai-non-engineer-work-reorganize
✉️ 訂閱電子報,每兩週收到一篇深度商業分析: https://yojuhsu.beehiiv.com/






















