
OpenAI 正式推出新一代模型 GPT-5.4,並同步在 ChatGPT、API 以及 Codex 平台上逐步開放。
如果仔細閱讀官方技術說明與開發者社群的回饋,會發現 GPT-5.4 其實代表了一個更深層的轉變:AI 正逐漸從回答問題的工具,變成可以執行完整工作流程的數位工作者。GPT-5.4 的核心定位:專為專業工作打造
OpenAI 對 GPT-5.4 的官方定位非常明確:「專為專業工作打造的前沿模型。」這一代模型整合了兩個重要能力來源。
第一是 GPT-5.2 的推理能力。
第二是 GPT-5.3-Codex 的程式開發能力。
兩者結合之後,GPT-5.4 成為一個同時具備:
- 推理能力
- 程式開發能力
- 專業知識工作能力
的通用 AI 系統。
在 OpenAI 的測試中,這個模型需要完成各種真實工作任務,例如建立財務模型、設計簡報、製作排班表或分析文件。結果顯示 GPT-5.4 在 83% 的任務中表現達到或超過專業人士水準。這意味著 AI 的角色不再只是用來搜尋資料或寫文章,而是開始具備完成實際工作產出的能力。
程式能力整合 Codex 是另一個顯著進步是程式開發能力。GPT-5.4 整合了先前 GPT-5.3-Codex 的程式能力,使其在開發與維護大型程式專案時表現更穩定。在 SWE-Bench Pro 測試中,GPT-5.4 的表現達到 57.7% 的成功率,略高於 GPT-5.2。
GPT-5.4 另一個重要改進,是與外部工具的整合能力。OpenAI 在這一代模型中導入 Tool Search(工具搜尋) 機制。過去在 AI 系統中,如果要讓模型使用某個工具,開發者必須事先把所有工具的定義放入提示詞之中。
當系統擁有大量工具時,這種方式會導致 Token 使用量暴增,回應速度也會變慢。而 GPT-5.4 的新機制則改變了這個流程。模型只需要知道有哪些工具存在,當真正需要時再搜尋並載入相關定義。
AI 開始能操作電腦
GPT-5.4 成為 OpenAI 第一個具備原生電腦操作能力的通用模型。透過新的 Computer Use Agent 技術,模型可以根據螢幕截圖判斷當前情境,並發出滑鼠與鍵盤指令,進而完成各種電腦操作任務。例如:
- 打開瀏覽器
- 操作網站
- 使用 Excel
- 建立文件或簡報
這意味著 AI 不只是在回答問題,而是開始能夠在電腦環境中執行實際任務。
AI 正在從聊天工具變成工作系統
如果把 GPT-5.4 的幾個關鍵能力放在一起,就會看到過去的 AI 系統主要是:模型 → 回答問題。而 GPT-5.4 的架構更像是:模型 + 工具 + 電腦操作 + 長上下文。最終形成一個可以執行完整工作流程的系統。
AI 可以搜尋資料、分析文件、建立試算表、生成簡報,甚至操作電腦完成任務。換句話說,AI 的角色正在從「聊天助手」轉變為「數位工作者」。
從產業角度來看,當 AI 開始具備操作電腦、使用工具與長時間推理的能力時,未來的應用模式很可能不再只是單一功能的 AI,而是由多個 AI Agent 組成的工作系統。
對企業而言,這意味著某些知識工作流程可能會逐漸自動化。而對開發者與新創公司而言,這也意味著建立 AI 產品的門檻正在快速下降。
某種程度上,GPT-5.4 不只是一次模型升級,而是 AI 正在逐步接近一個可以真正參與工作流程的數位同事


















