Anthropic Claude Opus 4.5 :從程式碼生產力到 Excel 自動化

更新 發佈閱讀 8 分鐘

Anthropic 在 2025 年 11 月 25 日推出了他們最新的旗艦模型 Claude Opus 4.5。在 AI 技術以驚人速度演進的今天,每一次的更新都可能改變我們與科技互動的方式。這次更新的核心問題是:當一個 AI 不僅能理解你的問題,甚至能像一位資深工程師一樣,主動尋找工具、編寫程式來解決複雜任務時,我們的工作模式將迎來何種革新?

Introducing Claude Opus 4.5

vocus|新世代的創作平台

Opus 4.5 登場:三大核心升級

  • 更強的模型能力:Claude Opus 4.5 在多項關鍵指標上,特別是軟體工程和程式設計能力,展現了超越業界頂尖模型的表現。內部測試甚至顯示,它在一項困難的程式設計 take-home 考試中,得分超過了所有人類應試者。
  • 更低的價格:儘管性能大幅提升,Opus 4.5 的價格卻更為親民,定價為每百萬 tokens 輸入 5 美元,輸出 25 美元,讓頂尖的 AI 能力不再遙不可及。
  • 更深度的應用整合:除了模型本身,Anthropic 還推出了全新的開發者工具,並將 Claude 的能力擴展到我們日常使用的軟體中,例如 Excel 和 Chrome 瀏覽器,讓 AI 從雲端走進了我們的桌面。

解構 AI 工程師:Opus 4.5 如何實現驚人突破?

「AI 工程師」的誕生?

這次更新最引人注目的,莫過於 Claude Opus 4.5 在軟體工程領域的卓越表現。在 SWE-bench 基準測試中,Opus 4.5 取得了領先的成績。更令人驚訝的是,在一項 Anthropic 內部用來評估潛在工程師候選人的高難度 take-home 考試中,Opus 4.5 的得分甚至超越了所有曾參加過此測試的人類工程師。

這代表 AI 解決複雜、真實世界程式設計問題的能力,已經達到甚至超越了有經驗的專業人士。從程式碼遷移、重構到修復橫跨多個系統的複雜錯誤,Opus 4.5 都展現出高度的自主性與準確性。許多早期測試的合作夥伴,如 GitHub 和 Notion,都驗證了它在處理長遠、自主任務上的穩定性和效率。

vocus|新世代的創作平台

開發者工具迎來三大革新

Anthropic 明白,一個強大的模型需要有靈活的工具才能發揮最大潛力。因此,他們同步推出了三項針對開發者的 beta 新功能,旨在解決當前 AI Agent 開發中的痛點:context window 限制、延遲和準確性。

  • 工具搜尋 (Tool Search):過去,開發者需要將所有可能的工具定義都預先載入到模型的 context window 中,這會消耗大量的 tokens。現在,透過工具搜尋,Claude 可以在需要時才動態地去「發現」並載入相關工具,這使得 context window 的使用效率大幅提升了 85%,同時也提高了工具選擇的準確性。
  • 程式化工具調用 (Programmatic Tool Calling):傳統的工具使用方式是模型每調用一次工具,就需要一次完整的 API 往返,並且所有中間過程的資料都會佔用 context。現在,Claude 可以直接編寫一段 Python 程式碼,一次性地、有邏輯地(例如使用迴圈、條件判斷)調用多個工具,並在程式碼層級處理中間資料,最後只將最重要的結果回傳給模型。這不僅大幅減少了 tokens 的消耗(內部測試顯示在複雜研究任務上減少了 37%),也因為減少了 API 往返次數而降低了延遲。
  • 工具使用範例 (Tool Use Examples):單純的工具定義(JSON Schema)有時不足以讓模型理解如何正確使用,特別是在有許多非必要參數或特定格式要求時。現在開發者可以直接在工具定義中提供具體的使用範例,讓 Claude 從範例中學習如何正確地格式化參數、處理巢狀結構等,內部測試顯示這將複雜參數的處理準確率從 72% 提升到了 90%。

從雲端走進桌面:Claude 如何融入你的日常工作流

Anthropic 的目標顯然不只是服務開發者,他們也希望將 AI 的能力無縫地融入每個人的日常工作中。這次更新,他們將 Claude 的應用範圍從網頁和 API 大幅擴展。

  • Claude for Excel:這項功能讓 Claude 直接進駐可能是全世界使用最廣泛的數據分析工具 Excel。使用者可以直接在 Excel 中,用自然語言詢問關於複雜公式的解釋、進行情境分析(例如「如果營收成長率提高 2%,對最終估值有何影響?」)、除錯,甚至從零開始建立財務模型。Claude 能夠理解整個工作簿的關聯性,並在修改時保持公式的完整性。
  • Claude Code 桌面應用:專業的程式設計工具 Claude Code 現在有了桌面版本,讓開發者可以在本機同時運行多個 AI Agent,一個負責修復 bug,另一個研究 GitHub 上的開源專案,第三個則負責撰寫文件,實現真正的平行工作。
  • 更聰明的對話與瀏覽器助理:在 Claude 的對話應用中,現在長對話不會再碰到極限,Claude 會自動總結之前的內容,讓你可以持續進行深度探討。同時,面向所有 Max 用戶開放的 Claude for Chrome 瀏覽器擴充功能,讓 Claude 能夠在你瀏覽網頁時提供跨分頁的協助。

TN科技筆記的觀點

這次 Anthropic 的更新「將 AI 從一個問答機器,轉變為一個真正能動手解決問題的『工作夥伴』」。過去,我們像是模型的管理者,需要一步步下指令、檢查中間結果。現在,我們更像是產品經理,提出最終目標(例如「找出第三季差旅預算超支的團隊成員」),而 Claude 則化身為那位資深工程師,自己編寫腳本、調用 API、處理數據,最後只把最精煉的結果呈現給你。這是一種從「對話」到「委派」的根本轉變,大幅提升了 AI 處理複雜工作流的自主性與效率。

然而,當 Claude 能夠像人類一樣時,如何確保它的行為始終與人類的最高利益保持一致,就成了一個更為複雜的問題。這不僅僅是防止惡意使用的「安全」(Safety) 問題,更是關乎模型價值觀與人類意圖對齊的「對齊」(Alignment) 問題。此外,當 AI 的程式設計能力超越許多人類工程師時,這對軟體工程師的職業發展、技能要求乃至整個科技行業的人才結構,都將帶來深遠的衝擊。


支持TN科技筆記,與科技共同前行

我是TN科技筆記,如果喜歡這篇文章,歡迎留言、點選愛心、轉發給我支持鼓勵~~~也歡迎每個月請我喝杯咖啡,鼓勵我撰寫更多科技文章,一起跟著科技浪潮前進!!>>>>> 請我喝一杯咖啡

在此也感謝每個月持續請我喝杯咖啡的讀者以及新加入的讀者們,讓我更加有動力為各位帶來科技新知!

以下是我的 threads 也歡迎追蹤、回覆、轉發喔!

>>>>> TN科技筆記(TechNotes)


留言
avatar-img
TN科技筆記(TechNotes)的沙龍
72會員
242內容數
大家好,我是TN,喜歡分享科技領域相關資訊,希望各位不吝支持與交流!
2025/11/24
Meta AI 推出新一代影像分割模型 SAM 3 與 3D 重建模型 SAM-3D。本文將深度解析其核心技術、應用場景,以及它如何透過文字指令和單張照片,改變我們與數位世界的互動方式。
Thumbnail
2025/11/24
Meta AI 推出新一代影像分割模型 SAM 3 與 3D 重建模型 SAM-3D。本文將深度解析其核心技術、應用場景,以及它如何透過文字指令和單張照片,改變我們與數位世界的互動方式。
Thumbnail
2025/11/21
深入分析NVIDIA 2026 Q3財報,逐一拆解關於應收帳款、庫存、現金流與「資金循環」的泡沫指控,揭示輝達高速成長背後的真實商業邏輯與潛在風險。
2025/11/21
深入分析NVIDIA 2026 Q3財報,逐一拆解關於應收帳款、庫存、現金流與「資金循環」的泡沫指控,揭示輝達高速成長背後的真實商業邏輯與潛在風險。
2025/11/19
Google 最新發布 Gemini 3 模型。本文將帶你了解其頂尖性能、核心的「AI 代理人」能力,以及為開發者打造的全新平台 Google Antigravity 將如何改變未來。
Thumbnail
2025/11/19
Google 最新發布 Gemini 3 模型。本文將帶你了解其頂尖性能、核心的「AI 代理人」能力,以及為開發者打造的全新平台 Google Antigravity 將如何改變未來。
Thumbnail
看更多
你可能也想看
Thumbnail
本篇文章探討百度在AI領域的核心戰略,包括閉源大模型的採用、AI as a Service的市場潛力以及智能體的廣泛應用。對於AI商業化,百度創辦人李彥宏強調應用的深度與效用才是關鍵。此外,百度如何在面對全球AI價格戰中,選擇不同的發展路徑和商業模式,將對未來的市場發展具有重要影響。
Thumbnail
本篇文章探討百度在AI領域的核心戰略,包括閉源大模型的採用、AI as a Service的市場潛力以及智能體的廣泛應用。對於AI商業化,百度創辦人李彥宏強調應用的深度與效用才是關鍵。此外,百度如何在面對全球AI價格戰中,選擇不同的發展路徑和商業模式,將對未來的市場發展具有重要影響。
Thumbnail
曾經是中國互聯網巨頭 BAT 市值第一、中國最大搜尋引擎的百度,如今市值卻跌至其他兩間公司的不到十分之一。近年來,百度加大對 AI(文心一言、阿波羅)和自駕車技術(蘿蔔快跑)的投入,積極轉型為「AI 公司」。面對阿里巴巴和騰訊等強大對手的挑戰,百度如何在 AI 時代重新站穩腳跟,甚至逆勢崛起?
Thumbnail
曾經是中國互聯網巨頭 BAT 市值第一、中國最大搜尋引擎的百度,如今市值卻跌至其他兩間公司的不到十分之一。近年來,百度加大對 AI(文心一言、阿波羅)和自駕車技術(蘿蔔快跑)的投入,積極轉型為「AI 公司」。面對阿里巴巴和騰訊等強大對手的挑戰,百度如何在 AI 時代重新站穩腳跟,甚至逆勢崛起?
Thumbnail
背景:從冷門配角到市場主線,算力與電力被重新定價   小P從2008進入股市,每一個時期的投資亮點都不同,記得2009蘋果手機剛上市,當時蘋果只要在媒體上提到哪一間供應鏈,隔天股價就有驚人的表現,當時光學鏡頭非常熱門,因為手機第一次搭上鏡頭可以拍照,也造就傳統相機廠的殞落,如今手機已經全面普及,題
Thumbnail
背景:從冷門配角到市場主線,算力與電力被重新定價   小P從2008進入股市,每一個時期的投資亮點都不同,記得2009蘋果手機剛上市,當時蘋果只要在媒體上提到哪一間供應鏈,隔天股價就有驚人的表現,當時光學鏡頭非常熱門,因為手機第一次搭上鏡頭可以拍照,也造就傳統相機廠的殞落,如今手機已經全面普及,題
Thumbnail
上篇文章《奧特曼傳》聚焦 OpenAI 如何從「讓 AI 造福人類」的理想出發,演變成資本與權力的角逐賽,奧特曼與馬斯克分道揚鑣後,OpenAI 與微軟攜手推出 ChatGPT,席捲全球;然而,真正的較量並不僅限於兩人,而是以「AI 霸主」之名,在更廣闊的戰場上展開......
Thumbnail
上篇文章《奧特曼傳》聚焦 OpenAI 如何從「讓 AI 造福人類」的理想出發,演變成資本與權力的角逐賽,奧特曼與馬斯克分道揚鑣後,OpenAI 與微軟攜手推出 ChatGPT,席捲全球;然而,真正的較量並不僅限於兩人,而是以「AI 霸主」之名,在更廣闊的戰場上展開......
Thumbnail
這次的內容,我將分享在政大聽完 OpenAI 的執行長技術顧問(Technical Advisor to the CEO) Dr. Mohammad Bavarian 在台灣的第一場演講,透過 OpenAI 官方的視角,探討人工通用智慧(AGI)的關鍵技術和未來趨勢。
Thumbnail
這次的內容,我將分享在政大聽完 OpenAI 的執行長技術顧問(Technical Advisor to the CEO) Dr. Mohammad Bavarian 在台灣的第一場演講,透過 OpenAI 官方的視角,探討人工通用智慧(AGI)的關鍵技術和未來趨勢。
Thumbnail
在AI迅速發展的當下,如何應對這場顛覆成為重要課題。萬維鋼在其著作《拐點:站在 AI 顛覆世界的前夜》中說明AI如何挑戰Google的搜尋霸主地位,並探討生成式AI的限制,以及在這個變革中個人如何利用AI提升決策能力,掌握未來的主導權。人要比AI凶!
Thumbnail
在AI迅速發展的當下,如何應對這場顛覆成為重要課題。萬維鋼在其著作《拐點:站在 AI 顛覆世界的前夜》中說明AI如何挑戰Google的搜尋霸主地位,並探討生成式AI的限制,以及在這個變革中個人如何利用AI提升決策能力,掌握未來的主導權。人要比AI凶!
Thumbnail
《轉轉生》(Re:INCARNATION)為奈及利亞編舞家庫德斯.奧尼奎庫與 Q 舞團創作的當代舞蹈作品,結合拉各斯街頭節奏、Afrobeat/Afrobeats、以及約魯巴宇宙觀的非線性時間,建構出關於輪迴的「誕生—死亡—重生」儀式結構。本文將從約魯巴哲學概念出發,解析其去殖民的身體政治。
Thumbnail
《轉轉生》(Re:INCARNATION)為奈及利亞編舞家庫德斯.奧尼奎庫與 Q 舞團創作的當代舞蹈作品,結合拉各斯街頭節奏、Afrobeat/Afrobeats、以及約魯巴宇宙觀的非線性時間,建構出關於輪迴的「誕生—死亡—重生」儀式結構。本文將從約魯巴哲學概念出發,解析其去殖民的身體政治。
Thumbnail
本文探討美國政府與企業在資訊產業,尤其開源軟體領域的法律責任。分析「免費」背後的商業策略,及其對全球市場和消費者權益的影響,並以藥品、汽車等產業案例對比,強調資訊產業須承擔法律責任,建立健康、公平的數位生態系統。
Thumbnail
本文探討美國政府與企業在資訊產業,尤其開源軟體領域的法律責任。分析「免費」背後的商業策略,及其對全球市場和消費者權益的影響,並以藥品、汽車等產業案例對比,強調資訊產業須承擔法律責任,建立健康、公平的數位生態系統。
Thumbnail
上禮拜有人問我:「你做《怪獸科技公司》是想讓大家知道科技變化很快,必須了解到這些應用以及如何因應,不過我們文組也早就知道 ChatGPT、Midjourney 這類 AI 了,你到底想要告訴我們什麼?」
Thumbnail
上禮拜有人問我:「你做《怪獸科技公司》是想讓大家知道科技變化很快,必須了解到這些應用以及如何因應,不過我們文組也早就知道 ChatGPT、Midjourney 這類 AI 了,你到底想要告訴我們什麼?」
Thumbnail
這是一場修復文化與重建精神的儀式,觀眾不需要完全看懂《遊林驚夢:巧遇Hagay》,但你能感受心與土地團聚的渴望,也不急著在此處釐清或定義什麼,但你的在場感受,就是一條線索,關於如何找著自己的路徑、自己的聲音。
Thumbnail
這是一場修復文化與重建精神的儀式,觀眾不需要完全看懂《遊林驚夢:巧遇Hagay》,但你能感受心與土地團聚的渴望,也不急著在此處釐清或定義什麼,但你的在場感受,就是一條線索,關於如何找著自己的路徑、自己的聲音。
Thumbnail
本文分析導演巴里・柯斯基(Barrie Kosky)如何運用極簡的舞臺配置,將布萊希特(Bertolt Brecht)的「疏離效果」轉化為視覺奇觀與黑色幽默,探討《三便士歌劇》在當代劇場中的新詮釋,並藉由舞臺、燈光、服裝、音樂等多方面,分析該作如何在保留批判核心的同時,觸及觀眾的觀看位置與人性幽微。
Thumbnail
本文分析導演巴里・柯斯基(Barrie Kosky)如何運用極簡的舞臺配置,將布萊希特(Bertolt Brecht)的「疏離效果」轉化為視覺奇觀與黑色幽默,探討《三便士歌劇》在當代劇場中的新詮釋,並藉由舞臺、燈光、服裝、音樂等多方面,分析該作如何在保留批判核心的同時,觸及觀眾的觀看位置與人性幽微。
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News