AI 戰局三月下旬:Claude 雙雄出擊、Cursor 編程智慧再進化、Meta 裁員轉向

更新 發佈閱讀 14 分鐘
vocus|新世代的創作平台



三月底的 AI 產業動態相當精采,Claude 同時推出 Sonnet 4.6 與 Opus 4.6 兩款重大更新,Cursor 正式發布 Composer 2,Meta 宣布裁員數百人並將資源傾注 AI 領域,Intel 推出專為 AI 設計的新顯卡,OpenAI 則傳出收購 Astral、暫停成人模式、與核融合公司 Helion 洽談能源合作。這些看似獨立的事件,實際上串連成一個更大的產業圖像:AI 正從「模型競賽」進入「應用落地」與「生態整合」的新階段。


Claude Sonnet 4.6:中階模型的天花板被打破了


Anthropic 這波更新最大的亮點不是最強的 Opus,而是 Sonnet 4.6。這個型號在幾乎所有評測中都逼近 Opus 4.5 的水準,價格卻維持在 Sonnet 4.5 的水準,每百萬輸入 token 只要 3 美元、輸出 token 15 美元。對企業用戶來說,這意味著原本需要付 5 美元輸入、25 美元輸出的 Opus 等級能力,現在可以用六分之一到七分之一的價格取得。


從技術角度來看,Sonnet 4.6 的進步來自兩個關鍵突破。第一是持續預訓練流程(continuous pretraining pipeline),這讓強化學習有更強大的基礎。第二是針對長時程任務的訓練方法,讓模型能處理需要數百個動作的複雜工作。在 Terminal-Bench 2.0 評測中,Sonnet 4.6 拿到 61.7 分,比前一代的 47.9 分大幅躍進;SWE-bench Multilingual 則從 65.9 提升到 73.7。


更值得注意的是電腦操作(computer use)能力的進化。Sonnet 4.6 在 OSWorld 評測上展現了「接近人類水準」的表現,能夠在複雜的試算表中導航、填寫多步驟網頁表單,然後跨多個瀏覽器分頁整合工作。這聽起來像是基礎功能,但實際上是企業自動化的關鍵:很多公司至今仍有大量「前 API 時代」的系統,需要人工操作才能完成工作。一個能夠用虛擬滑鼠和鍵盤操作這些系統的模型,等於把這些「自動化死角」全部打通。


早期測試者的反應很有意思。他們不僅偏好 Sonnet 4.6 勝過前一代,甚至有 59% 的情況下偏好 Sonnet 4.6 勝過去年十一月推出的 Opus 4.5。測試者形容 Sonnet 4.6 「不太會過度設計」「比較不會偷懶」「指令遵循能力更強」,這些都是實際工作場景中真正重要的特質。不是模型能回答多難的問題,而是它能不能可靠地完成你交代的工作。


Sonnet 4.6 還有一個實驗性的功能:100 萬 token 的上下文視窗。雖然還在 beta 階段,但這意味著模型可以在一次對話中載入完整程式碼庫、數十份研究論文或數百頁的法律文件。對於需要長時間工作的代理型任務來說,這是一個相當重要的能力。


Claude Opus 4.6:重新定義旗艦模型的標準


如果 Sonnet 4.6 是「性價比之王」,那 Opus 4.6 就是「性能天花板」的重新定義。這是 Anthropic 最強的模型,在多個評測中都達到業界領先水準。Terminal-Bench 2.0 拿到最高分,Humanity's Last Exam 這個複雜的多學科推理測試也領先其他前沿模型。


但更值得關注的是 Opus 4.6 在 GDPval-AA 評測的表現。這個評測專門衡量模型在經濟價值高的知識工作上的表現,涵蓋金融、法律等領域。Opus 4.6 在這個評測上比業界次佳模型(OpenAI 的 GPT-5.2)高出約 144 ELO 分,比前一代 Opus 4.5 高出 190 分。這不是量的差異,而是質的飛躍。


Opus 4.6 帶來的新功能也有實際意義。在 Claude Code 中,現在可以組建「代理團隊」共同處理任務;在 API 層面,模型可以自動壓縮自己的上下文,讓長時間運行的任務不會因為 token 限制而中斷。還有一個叫做「adaptive thinking」的功能,讓模型能夠根據上下文線索判斷該用多少推理深度,搭配新的 effort 控制參數,讓開發者在智慧、速度和成本之間有更多掌控權。


早期合作者的回饋相當正面。Notion 團隊說 Opus 4.6 「感覺不像工具,更像是一個有能力的合作者」。Devin 團隊指出它捕捉 bug 的能力大幅提升。Box 團隊在法律、金融、技術內容的多來源分析上看到了 10% 的性能提升。Lovable 團隊則稱讚它的設計品質提升,能夠「漂亮地配合設計系統工作」。


Opus 4.6 也首次為 Opus 等級模型帶來了 100 萬 token 的上下文視窗。這意味著最強的模型現在也能處理最大規模的文件和程式碼庫,不需要在「強」和「廣」之間做選擇。


Cursor Composer 2:編程智慧的效率革命


Cursor 在三月十九日推出了 Composer 2,這是一次專注於「效率」而非單純「性能」的更新。在 CursorBench 評測中,Composer 2 從 44.2 分躍升到 61.3 分;Terminal-Bench 2.0 從 47.9 提升到 61.7;SWE-bench Multilingual 則從 65.9 提升到 73.7。數字看起來和 Claude 的進步規模相似,這不是巧合,Cursor 在模型選擇和訓練策略上走出了自己的路線。


但真正的亮點在價格。Composer 2 的定價是每百萬輸入 token 0.50 美元、輸出 token 2.50 美元,這比大多數主流模型便宜了一個數量級。Cursor 還提供了一個「智慧相同但更快」的版本,定價為每百萬輸入 token 1.50 美元、輸出 token 7.50 美元,並將這個版本設為預設。這背後的邏輯很清楚:大多數日常編程工作不需要最強的模型,需要的是「夠強且夠快」的模型。


Composer 2 的技術核心是「正規表示式搜尋索引」,這讓代理能在大型 monorepo 中搜尋文字,而不需要等待 15 秒的 ripgrep 掃描。對於每天要處理數百次搜尋的開發者來說,這節省的時間相當可觀。Cursor 團隊還開發了一套「自我摘要」訓練方法,讓模型能從遠超過上下文視窗的軌跡中取得訓練訊號,這對於處理長時程任務尤其重要。


從產品角度來看,Cursor 最近動作頻頻。三月五日推出自動化流程功能,讓代理能根據自訂觸發條件和指令自動執行;三月十一日在 Marketplace 新增超過 30 款外掛;三月十六日發布安全代理功能,在快速變動的程式碼庫中持續找出並修正漏洞;三月十八日宣布 Money Forward 有超過 1000 名員工每天使用 Cursor;三月二十五日推出雲端代理的自行託管功能,讓程式碼和工具完全留在企業網路內。


這一連串更新指向一個明確方向:Cursor 不只是在做「更好的編程助手」,而是在建立一個完整的「AI 編程生態」。從個人開發者到企業團隊,從單機 IDE 到雲端部署,從安全審計到自動化流程,這些都是吸引企業採用的關鍵功能。


Meta 裁員轉向:AI 时代的資源重配置


Meta 在三月下旬宣布裁減數百名員工,影響範圍涵蓋 Reality Labs、招聘、社群媒體和銷售團隊。這是新聞標題,但真正的故事在於這代表 Meta 正在進行一場更大規模的資源重配置。


從財報數據來看,Meta 在 AI 基礎建設上的投資相當驚人。2025 年資本支出預估在 340 到 380 億美元之間,主要集中在資料中心和 GPU 採購。Reality Labs 雖然持續虧損(2024 年虧損超過 160 億美元),但元宇宙的長期布局並沒有放棄,而是與 AI 進行更緊密的整合。Ray-Ban Meta 智慧眼鏡就是一個例子:AI 智慧助手是其核心賣點之一。


但歐盟的新電池法規給這個計畫帶來了變數。2027 年起,歐盟要求所有行動裝置必須配備可拆卸電池。這對 Meta 來說是個實際問題:Ray-Ban Display 智慧眼鏡的電池設計不符合這項要求,而重新設計意味著延遲上市。Meta 據報導正在與歐盟討論可能的解決方案,但這類監管挑戰會成為 AI 硬體産品的常態。


裁員決策背後的邏輯其實很清楚:AI 正在重塑科技公司的組織結構。需要更多 AI 工程師、更多晶片專家、更多資料科學家;需要較少的是傳統招聘團隊、維護既有産品的工程師、以及負責非核心業務的銷售人員。這不是「AI 取代人類」的新聞標題,而是「AI 驅動組織重組」的實際執行。


對開發者和企業來說,Meta 的動向值得關注。因為 Meta 是少數同時擁有超級電腦(用於訓練 Llama 系列)、社交平台(Facebook、Instagram)、和硬體産品線(Quest、Ray-Ban 眼鏡)的科技公司。它的 AI 戰略會影響整個産業的走向。


Intel Arc Pro B70:AI 專用顯卡的定位戰


Intel 在三月推出了 Arc Pro B70 桌面顯卡,配備 32GB VRAM 和最多 32 個 Xe2 核心,定價 949 美元。還有一個 B65 Pro 版本,配備 20 個 Xe2 核心,由合作夥伴生産。


這張卡的定位很明確:AI 和專業運算,不是遊戲。Intel 官方直言這是「專為 AI 設計」的産品。32GB VRAM 在這價位段相當有競爭力,因為 NVIDIA 的 RTX 4090 雖然更強,但價格已經超過 1500 美元;AMD 的 Radeon PRO W7900 雖然價格相近,但軟體生態仍不如 CUDA 成熟。Intel 的機會在於提供一個「夠用且便宜」的選項,尤其是在模型推論(inference)場景,而不需要 NVIDIA 等級的算力。


但問題也很明顯:軟體生態。CUDA 經過十多年的累積,在 AI 框架支援上有壓倒性優勢。Intel 的 oneAPI 和 OpenCL 雖然持續改進,但距離「開箱即用」的水準還有差距。對於願意調校環境的開發者,Arc Pro B70 可能是不錯的選擇;但對於追求穩定的企業用戶,NVIDIA 仍然是安全牌。


這個産品反映出 Intel 的戰略轉向。過去 Intel 依賴 CPU 獨大,GPU 只是附屬品;現在 AI 運算需求暴增,Intel 必須在 GPU 市場找到立足點。Arc Pro 系列就是這個戰略的具體産品,鎖定專業市場而非消費級遊戲市場,是一個理性的選擇。


OpenAI 的多線並進:收購、能源、與産品策略調整


OpenAI 最近的新聞相當多元,從産品決策到企業策略都有。


首先是暫停 ChatGPT 的「成人模式」計畫。這個計畫原本要讓 ChatGPT 能夠處理成人內容,與 Sora 影片生成器的定位類似,都是要拓展模型的應用邊界。但 OpenAI 最終決定暫停,官方說法是「專注於核心産品」。這背後可能有多種考量:安全風險、品牌形象、監管壓力,或是單純的資源分配。無論如何,這代表 OpenAI 在産品策略上正在做選擇:哪些功能要做,哪些可以放棄。


第二是收購 Astral 的傳聞。Astral 是一個生産力工具公司,如果收購成真,意味著 OpenAI 正在加強「企業應用」的能力。這與 Claude Cowork、Notion AI 的競爭邏輯一致:模型本身只是基礎,如何嵌入工作流程才是企業付費的關鍵。


第三是與 Helion Energy 的能源談判。創辦人 Sam Altman 已經辭去 Helion 董事會主席職務以避免利益衝突,但 OpenAI 據報導正在「深入談判」採購 Helion 的核融合電力。這聽起來很科幻,但背後的邏輯很實際:AI 運算需要大量電力,電力成本是 AI 公司最大的營運支出之一。如果能鎖定未來的清潔能源供應,對成本控制和 ESG 形象都有好處。當然,核融合技術目前仍在實驗階段,這筆交易是否能實現還有變數。


這三件事看似獨立,實際上都指向同一個方向:OpenAI 正在從「模型公司」轉型為「AI 基礎建設公司」。模型只是入口,能源是底層,企業應用是付費點。這個轉型能否成功,會決定 OpenAI 在下一個五年的市場地位。


如果只記一件事


這波更新最核心的訊息是:AI 的競爭已經從「誰的模型最強」轉向「誰能以最低成本提供最強能力」。Claude Sonnet 4.6 用六分之一到七分之一的價格提供接近 Opus 4.5 的性能,這不是小改進,而是典範轉移。當「最強」和「最便宜」之間的差距縮小到一定程度,企業的採購決策會徹底改變。你可以同時用 Sonnet 4.6 處理量大但不需要最強推理的日常工作,用 Opus 4.6 處理真正複雜的任務,用 Cursor Composer 2 處理編程工作,而不需要擔心帳單失控。這才是這波更新真正改變的事情。


留言
avatar-img
今天學 AI
0會員
23內容數
AI 離你沒有那麼遠。「今天學 AI」每天為你整理最新的 AI 工具實測、產業動態、商業案例與技術解析,用你聽得懂的話,幫你跟上這個變化最快的時代。不管你是好奇的新手,還是想把 AI 用在工作裡的行動派,這裡都是你的第一站。
今天學 AI的其他內容
2026/03/25
這一週的 AI 新聞有幾個特別值得注意的趨勢。NVIDIA 執行長 Jensen Huang 在公開場合宣稱「我們已經達成 AGI」,引發了產業界對於通用人工智慧定義的新一輪討論。另一方面,Anthropic 正在與美國國防部進行法律訴訟,因為該公司被列為供應鏈風險,這場衝突涉及到 AI 公
Thumbnail
2026/03/25
這一週的 AI 新聞有幾個特別值得注意的趨勢。NVIDIA 執行長 Jensen Huang 在公開場合宣稱「我們已經達成 AGI」,引發了產業界對於通用人工智慧定義的新一輪討論。另一方面,Anthropic 正在與美國國防部進行法律訴訟,因為該公司被列為供應鏈風險,這場衝突涉及到 AI 公
Thumbnail
2026/03/24
科技產業從來不缺誇張宣稱,但當 Nvidia 執行長 Jensen Huang 說「我們已經達成 AGI」的時候,整個圈子還是震了一下。不是因為這句話多了不起,而是因為說這話的人、說話的時機、以及這句話背後隱含的商業盤算,都值得拆解。 同時,OpenAI 正在談判向 Sam Altma
Thumbnail
2026/03/24
科技產業從來不缺誇張宣稱,但當 Nvidia 執行長 Jensen Huang 說「我們已經達成 AGI」的時候,整個圈子還是震了一下。不是因為這句話多了不起,而是因為說這話的人、說話的時機、以及這句話背後隱含的商業盤算,都值得拆解。 同時,OpenAI 正在談判向 Sam Altma
Thumbnail
2026/03/23
2026 年三月的第三週,AI 產業接連丟出好幾個震撼彈。Zuckerberg 據報正在訓練自己的 AI CEO 代理、WordPress 開放 AI 代理直接發文、Cursor 推出新一代編碼模型、Meta 宣布用 AI 取代內容審核的人力外包、Samsung 宣布七百三十億美元的超大資本
Thumbnail
2026/03/23
2026 年三月的第三週,AI 產業接連丟出好幾個震撼彈。Zuckerberg 據報正在訓練自己的 AI CEO 代理、WordPress 開放 AI 代理直接發文、Cursor 推出新一代編碼模型、Meta 宣布用 AI 取代內容審核的人力外包、Samsung 宣布七百三十億美元的超大資本
Thumbnail
看更多
你可能也想看
Thumbnail
Elon Musk 的 xAI 在 2025 年 9 月 20 日推出的 Grok 4 Fast,一款經過高度優化、專注於速度與成本效益的模型,直接挑戰「高品質等於高成本」的規則。
Thumbnail
Elon Musk 的 xAI 在 2025 年 9 月 20 日推出的 Grok 4 Fast,一款經過高度優化、專注於速度與成本效益的模型,直接挑戰「高品質等於高成本」的規則。
Thumbnail
即便關稅風暴來襲,廣達(2382)依然全速前進。 在全球供應鏈持續調整之際,廣達董事長林百里強調,「有多少訂單就趕多少貨」,目前AI伺服器訂單並未受美國對中關稅影響。 更重要的是,他看見資料中心投資將成為科技冷戰時代的新戰場,客戶需求不減,廣達準備跟上這場馬拉松。
Thumbnail
即便關稅風暴來襲,廣達(2382)依然全速前進。 在全球供應鏈持續調整之際,廣達董事長林百里強調,「有多少訂單就趕多少貨」,目前AI伺服器訂單並未受美國對中關稅影響。 更重要的是,他看見資料中心投資將成為科技冷戰時代的新戰場,客戶需求不減,廣達準備跟上這場馬拉松。
Thumbnail
全球 AI 產業正在進入一場「算力戰爭與國力競賽」的加速期:輝達與英特爾罕見結盟,將重塑半導體版圖;OpenAI 與 Anthropic 模型表現直逼人類專家,顯示白領職場即將迎來全新分工;同時黃仁勳警告,各國必須自建「主權AI」,否則將在未來的科技國力爭奪中失去立足之地。
Thumbnail
全球 AI 產業正在進入一場「算力戰爭與國力競賽」的加速期:輝達與英特爾罕見結盟,將重塑半導體版圖;OpenAI 與 Anthropic 模型表現直逼人類專家,顯示白領職場即將迎來全新分工;同時黃仁勳警告,各國必須自建「主權AI」,否則將在未來的科技國力爭奪中失去立足之地。
Thumbnail
本文分析導演巴里・柯斯基(Barrie Kosky)如何運用極簡的舞臺配置,將布萊希特(Bertolt Brecht)的「疏離效果」轉化為視覺奇觀與黑色幽默,探討《三便士歌劇》在當代劇場中的新詮釋,並藉由舞臺、燈光、服裝、音樂等多方面,分析該作如何在保留批判核心的同時,觸及觀眾的觀看位置與人性幽微。
Thumbnail
本文分析導演巴里・柯斯基(Barrie Kosky)如何運用極簡的舞臺配置,將布萊希特(Bertolt Brecht)的「疏離效果」轉化為視覺奇觀與黑色幽默,探討《三便士歌劇》在當代劇場中的新詮釋,並藉由舞臺、燈光、服裝、音樂等多方面,分析該作如何在保留批判核心的同時,觸及觀眾的觀看位置與人性幽微。
Thumbnail
德國新創 Agile Robots 發表全尺寸人形機器人 Agile ONE,主打「真正能在工廠上班」的工業級應用,包括物料搬運、上下料、使用工具與精細操作。它具備 21 關節靈巧雙手、全身感知,以及以真實產線資料訓練的工業 AI。這次登場被視為歐洲正式加入人形機器人的工業實用化競賽。
Thumbnail
德國新創 Agile Robots 發表全尺寸人形機器人 Agile ONE,主打「真正能在工廠上班」的工業級應用,包括物料搬運、上下料、使用工具與精細操作。它具備 21 關節靈巧雙手、全身感知,以及以真實產線資料訓練的工業 AI。這次登場被視為歐洲正式加入人形機器人的工業實用化競賽。
Thumbnail
很多時候我們會覺得,台灣之所以被全世界關注,是因為台積電的先進製程。但真正撐起這座「天選矽島」的,是遍佈全島、無所不在的 ICT 產業生態系。本文探討美中科技戰、供應鏈去中化對臺灣的影響,並分析臺灣、美國、中國、日本、韓國等國家的產業定位和戰略選擇。
Thumbnail
很多時候我們會覺得,台灣之所以被全世界關注,是因為台積電的先進製程。但真正撐起這座「天選矽島」的,是遍佈全島、無所不在的 ICT 產業生態系。本文探討美中科技戰、供應鏈去中化對臺灣的影響,並分析臺灣、美國、中國、日本、韓國等國家的產業定位和戰略選擇。
Thumbnail
背景:從冷門配角到市場主線,算力與電力被重新定價   小P從2008進入股市,每一個時期的投資亮點都不同,記得2009蘋果手機剛上市,當時蘋果只要在媒體上提到哪一間供應鏈,隔天股價就有驚人的表現,當時光學鏡頭非常熱門,因為手機第一次搭上鏡頭可以拍照,也造就傳統相機廠的殞落,如今手機已經全面普及,題
Thumbnail
背景:從冷門配角到市場主線,算力與電力被重新定價   小P從2008進入股市,每一個時期的投資亮點都不同,記得2009蘋果手機剛上市,當時蘋果只要在媒體上提到哪一間供應鏈,隔天股價就有驚人的表現,當時光學鏡頭非常熱門,因為手機第一次搭上鏡頭可以拍照,也造就傳統相機廠的殞落,如今手機已經全面普及,題
Thumbnail
本文探討Elon Musk的xAI公司推出的最新大型語言模型Grok 4,並比較Grok 4與其他AI模型,例如OpenAI的GPT-4o、Google的Gemini 1.5 Pro和Anthropic的Claude 3 Opus的優缺點與適用情境。
Thumbnail
本文探討Elon Musk的xAI公司推出的最新大型語言模型Grok 4,並比較Grok 4與其他AI模型,例如OpenAI的GPT-4o、Google的Gemini 1.5 Pro和Anthropic的Claude 3 Opus的優缺點與適用情境。
Thumbnail
這篇文章將帶你了解 OpenAI 與 AMD 簽下 6GW 晶片長約的全貌:你會知道新聞重點與協議細節、前因後果與完整時間線、AMD MI450 晶片的技術與成本影響、對 NVIDIA 與台灣供應鏈的實際意義。看完,你能掌握 AI 硬體戰局下一回合的核心觀察點。
Thumbnail
這篇文章將帶你了解 OpenAI 與 AMD 簽下 6GW 晶片長約的全貌:你會知道新聞重點與協議細節、前因後果與完整時間線、AMD MI450 晶片的技術與成本影響、對 NVIDIA 與台灣供應鏈的實際意義。看完,你能掌握 AI 硬體戰局下一回合的核心觀察點。
Thumbnail
AMD 發表對抗 NVIDIA DGX Spark 的秘密武器:Ryzen AI Halo 迷你主機。對於苦於 AI 硬體選項稀少、或希望擺脫雲端算力依賴的開發者與專業人士來說,Ryzen AI Halo 的出現無疑是個令人振奮的消息。它象徵著一個更開放、更具競爭力的 AI 硬體生態系正在成形。
Thumbnail
AMD 發表對抗 NVIDIA DGX Spark 的秘密武器:Ryzen AI Halo 迷你主機。對於苦於 AI 硬體選項稀少、或希望擺脫雲端算力依賴的開發者與專業人士來說,Ryzen AI Halo 的出現無疑是個令人振奮的消息。它象徵著一個更開放、更具競爭力的 AI 硬體生態系正在成形。
Thumbnail
《轉轉生》(Re:INCARNATION)為奈及利亞編舞家庫德斯.奧尼奎庫與 Q 舞團創作的當代舞蹈作品,結合拉各斯街頭節奏、Afrobeat/Afrobeats、以及約魯巴宇宙觀的非線性時間,建構出關於輪迴的「誕生—死亡—重生」儀式結構。本文將從約魯巴哲學概念出發,解析其去殖民的身體政治。
Thumbnail
《轉轉生》(Re:INCARNATION)為奈及利亞編舞家庫德斯.奧尼奎庫與 Q 舞團創作的當代舞蹈作品,結合拉各斯街頭節奏、Afrobeat/Afrobeats、以及約魯巴宇宙觀的非線性時間,建構出關於輪迴的「誕生—死亡—重生」儀式結構。本文將從約魯巴哲學概念出發,解析其去殖民的身體政治。
Thumbnail
這是一場修復文化與重建精神的儀式,觀眾不需要完全看懂《遊林驚夢:巧遇Hagay》,但你能感受心與土地團聚的渴望,也不急著在此處釐清或定義什麼,但你的在場感受,就是一條線索,關於如何找著自己的路徑、自己的聲音。
Thumbnail
這是一場修復文化與重建精神的儀式,觀眾不需要完全看懂《遊林驚夢:巧遇Hagay》,但你能感受心與土地團聚的渴望,也不急著在此處釐清或定義什麼,但你的在場感受,就是一條線索,關於如何找著自己的路徑、自己的聲音。
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News