2026-04-17 AI news Notes

更新 發佈閱讀 8 分鐘

OpenAI|GPT-5.4-Cyber

Trusted access for the next era of cyber defense | OpenAI
OpenAI公布GPT 5.4-Cyber,開放更多資安人員使用 | iThome
回應 Anthropic 資安布局,OpenAI 發表 GPT-5.4-Cyber 新模型 | TechNews 科技新報


OpenAI 不是丟一個資安模型
而是把 GPT-5.4-Cyber 放進 Trusted Access for Cyber 這套框架裡

不是每個人都直接拿到同樣的 cyber 能力
而是開始走 能力 + 身分驗證 + 分級存取 這種部署方式
最高 tier 的已驗證防禦方才會拿到 GPT-5.4-Cyber

特別為 defensive cybersecurity fine-tune對合法資安工作更 permissive,也明講支援 binary reverse engineering,讓資安人員在沒有原始碼時也能分析編譯後軟體、惡意程式風險與漏洞

不是「又一個新模型」
而是高風險資安能力開始被做成 可控開放 的產品模式


Google Chrome|Skills in Chrome

Turn your best AI prompts into one-click tools in Chrome | Google
Google在Chrome導入Skills,將AI提示轉為可重複執行的工作流程 | iThome


Chrome Skills 就是
平常在 Gemini in Chrome 裡常用的 prompt,存成可以重複執行的「一鍵工具」
=> prompt 不再只是一次性對話,而是開始變成可重複使用的 workflow

作法: 可以從 chat history 把 prompt 存成 Skill

之後在任何頁面叫出來執行還能跨多個 tabs 一起跑,另外 Google 也放了一個現成的 Skills library 可以直接拿來改

桌面版 Gemini in Chrome
支援 Mac、Windows、ChromeOS,但 Chrome 語言要設成 English-US

Chrome 正在把 prompt 產品化成「瀏覽器裡可重複執行的小工具」


Cursor × NVIDIA|Multi-Agent Kernels

利用多代理系統將 GPU kernel 加速 38% | Cursor
SOL-ExecBench: Speed-of-Light Benchmarking for Real-World GPU Kernels Against Hardware Limits | arXiv

GPU kernel 加速 38%
且它在證明:multi-agent 已經可以碰很硬的低階工程最佳化問題

NVIDIA 的 SOL-ExecBench
是從 124 個正式與新興 AI 模型 裡抽出 235 個真實 kernel 最佳化問題

重點不是單一 agent 一路寫到底,而是有 planner 去分派、重平衡工作,worker agents 再自己測試、除錯、最佳化,形成自動迭代循環

agent system 已經開始往 kernel / compiler / benchmark 門檻場景延伸


Gemini Robotics-ER 1.6|Embodied Reasoning

Gemini Robotics-ER 1.6: Enhanced Embodied Reasoning | Google DeepMind

Gemini Robotics-ER 1.6 不是低階控制模型
比較像是機器人的高階 reasoning 腦

負責做 視覺 / 空間理解、任務規劃、成功判定

而且可以原生呼叫 Google Search、VLA 模型 或其他第三方函式

三個點:

  1. pointing / spatial reasoning 更強,連 counting、關係判斷也一起進步
  2. multi-view success detection,也就是能整合多個相機視角判斷事情到底有沒有真的完成
  3. instrument reading,能讀壓力表、液位計、數位讀值,這是和 Boston Dynamics 合作時挖到的重要場景

還有 instrument reading 因為它不是單純 OCR

而是 agentic vision + code execution
先 zoom in,再用 pointing 找刻度和指針,接著用程式估比例與區間,最後再結合世界知識解讀

這代表 embodied AI 已經開始碰到更像工業現場的真實推理任務

不只是「機器人看得更懂」
而是開始具備比較像 agent 的觀察、判斷、驗證能力


Anthropic|Mythos / Project Glasswing

Project Glasswing | Anthropic
Anthropic co-founder confirms the company briefed the Trump administration on Mythos | TechCrunch

Anthropic 不是把 Mythos 公開
而是把 Claude Mythos Preview 以 gated research preview 的方式,先交給關鍵基礎設施相關夥伴和額外 40 多個組織做防禦用途

官方列出的 launch partners
包含 AWS、Apple、Cisco、CrowdStrike、Google、JPMorganChase、Microsoft、NVIDIA、Palo Alto Networks

最重的一句是官方自己寫的
Mythos Preview 已經找出數千個 critical infrastructure 的 zero-day vulnerabilities
所以它不是單純「coding 很強」,而是已經強到 Anthropic 必須先用受控方式釋出。

另外 Jack Clark 也公開確認,他們有向 Trump administration 簡報這個模型,代表這件事已經不只是產品新聞,而是開始進入政策與國安視角

Claude Opus 4.7

  • 更強 instruction following(更「字面化」,舊 prompt 可能失效)
  • 強化 multi-session memory(檔案系統層)
  • 支援更高解析 vision + 長任務 agent 模式

Mythos 太強了開放個小的給各位玩玩

Introducing Claude Opus 4.7 \ Anthropic

Claude Code 一些更新

整合 terminal / diff / file editing
重構 desktop + multi-session

Redesigning Claude Code on desktop for parallel agents | Claude

Gemini 3.1 Flash TTS

  • 可用自然語言控制語氣、節奏、角色
  • 支援多角色對話 + 70+ 語言
  • 加入 SynthID watermark(內容可驗證)

Gemini 3.1 Flash TTS: New text-to-speech AI model

留言
avatar-img
Chrouos 的空間
1會員
14內容數
隨筆紀錄
Chrouos 的空間的其他內容
2026/04/14
Anthropic|Claude for Wordz, METR|Task-Completion Time Horizons, LangChain|Agent Harness = Memory Ownership, MiniMax|M2.7 開源釋出
2026/04/14
Anthropic|Claude for Wordz, METR|Task-Completion Time Horizons, LangChain|Agent Harness = Memory Ownership, MiniMax|M2.7 開源釋出
2026/04/10
Meta: Muse Spark, TorchTPU, Anthropic|Claude Managed Agents
2026/04/10
Meta: Muse Spark, TorchTPU, Anthropic|Claude Managed Agents
2026/04/08
OpenAI Image V2, Meta Avocado & Mango, Netflix VOID, GEO
2026/04/08
OpenAI Image V2, Meta Avocado & Mango, Netflix VOID, GEO
看更多
你可能也想看
Thumbnail
當時間變少之後,看戲反而變得更加重要——這是在成為母親之後,我第一次誠實地面對這一件事:我沒有那麼多的晚上,可以任性地留給自己了。看戲不再只是「今天有沒有空」,而是牽動整個週末的結構,誰應該照顧孩子,我該在什麼時間回到家,隔天還有沒有精神帶小孩⋯⋯於是,我不得不學會一件以前並不擅長的事:挑選。
Thumbnail
當時間變少之後,看戲反而變得更加重要——這是在成為母親之後,我第一次誠實地面對這一件事:我沒有那麼多的晚上,可以任性地留給自己了。看戲不再只是「今天有沒有空」,而是牽動整個週末的結構,誰應該照顧孩子,我該在什麼時間回到家,隔天還有沒有精神帶小孩⋯⋯於是,我不得不學會一件以前並不擅長的事:挑選。
Thumbnail
5 月,方格創作島正式開島。這是一趟 28 天的創作旅程。活動期間,每週都會有新的任務地圖與陪跑計畫,從最簡單的帳號使用、沙龍建立,到帶著你從一句話、一張照片開始,一步一步找到屬於自己的創作節奏。不需要長篇大論,不需要完美的文筆,只需要帶上你今天的日常,就可以出發。征服創作島,抱回靈感與大獎!
Thumbnail
5 月,方格創作島正式開島。這是一趟 28 天的創作旅程。活動期間,每週都會有新的任務地圖與陪跑計畫,從最簡單的帳號使用、沙龍建立,到帶著你從一句話、一張照片開始,一步一步找到屬於自己的創作節奏。不需要長篇大論,不需要完美的文筆,只需要帶上你今天的日常,就可以出發。征服創作島,抱回靈感與大獎!
Thumbnail
🧠 Gemini AI 2.5 Flash × Deep Research 全攻略 一鍵整理資料、多輪思考,讓研究與寫作高效進化! 🔍 為什麼選 Gemini 2.5 Flash? Gemini 2.5 Flash 是 Google 推出的高速、大記憶、多資料理解的 AI 模型,特別適合
Thumbnail
🧠 Gemini AI 2.5 Flash × Deep Research 全攻略 一鍵整理資料、多輪思考,讓研究與寫作高效進化! 🔍 為什麼選 Gemini 2.5 Flash? Gemini 2.5 Flash 是 Google 推出的高速、大記憶、多資料理解的 AI 模型,特別適合
Thumbnail
ChatGPT推出錄製模式,直接錄製會議、產生逐字稿和摘要,速度遠勝仍在Beta階段的Notion AI會議記錄。此現象凸顯應用層產品仰賴外部模型的風險,一旦原廠直接進場,應用層產品的優勢將迅速被超越。本文分析兩者差異,並探討應用層產品如何在競爭中生存。
Thumbnail
ChatGPT推出錄製模式,直接錄製會議、產生逐字稿和摘要,速度遠勝仍在Beta階段的Notion AI會議記錄。此現象凸顯應用層產品仰賴外部模型的風險,一旦原廠直接進場,應用層產品的優勢將迅速被超越。本文分析兩者差異,並探討應用層產品如何在競爭中生存。
Thumbnail
見諸參與鄧伯宸口述,鄧湘庭於〈那個大霧的時代〉記述父親回憶,鄧伯宸因故遭受牽連,而案件核心的三人,在鄧伯宸記憶裡:「成立了成大共產黨,他們製作了五星徽章,印刷共產黨宣言——刻鋼板的——他們收集中共空飄的傳單,以及中國共產黨中央委員會有關文化大革命決議文的英文打字稿,另外還有手槍子彈十發。」
Thumbnail
見諸參與鄧伯宸口述,鄧湘庭於〈那個大霧的時代〉記述父親回憶,鄧伯宸因故遭受牽連,而案件核心的三人,在鄧伯宸記憶裡:「成立了成大共產黨,他們製作了五星徽章,印刷共產黨宣言——刻鋼板的——他們收集中共空飄的傳單,以及中國共產黨中央委員會有關文化大革命決議文的英文打字稿,另外還有手槍子彈十發。」
Thumbnail
1. 當你們忙著用 AI 拚完美,我卻用它來「打發時間」 最近我的社群版面幾乎被 Google 的新玩具給洗版了。 朋友們都在驚嘆:NotebookLM 現在竟然能一鍵生成精美的簡報投影片,不用再熬夜做 PPT;或是那個名字聽起來很好吃的 Nano Banana 模型,終於能畫出繁體中文不再亂碼
Thumbnail
1. 當你們忙著用 AI 拚完美,我卻用它來「打發時間」 最近我的社群版面幾乎被 Google 的新玩具給洗版了。 朋友們都在驚嘆:NotebookLM 現在竟然能一鍵生成精美的簡報投影片,不用再熬夜做 PPT;或是那個名字聽起來很好吃的 Nano Banana 模型,終於能畫出繁體中文不再亂碼
Thumbnail
當代名導基里爾.賽勒布倫尼科夫身兼電影、劇場與歌劇導演,其作品流動著強烈的反叛與詩意。在俄烏戰爭爆發後,他持續以創作回應專制體制的壓迫。《傳奇:帕拉贊諾夫的十段殘篇》致敬蘇聯電影大師帕拉贊諾夫。本文作者透過媒介本質的分析,解構賽勒布倫尼科夫如何利用影劇雙棲的特質,在荒謬世道中尋找藝術的「生存之道」。
Thumbnail
當代名導基里爾.賽勒布倫尼科夫身兼電影、劇場與歌劇導演,其作品流動著強烈的反叛與詩意。在俄烏戰爭爆發後,他持續以創作回應專制體制的壓迫。《傳奇:帕拉贊諾夫的十段殘篇》致敬蘇聯電影大師帕拉贊諾夫。本文作者透過媒介本質的分析,解構賽勒布倫尼科夫如何利用影劇雙棲的特質,在荒謬世道中尋找藝術的「生存之道」。
Thumbnail
Notebook LM 最強大的 AI 學習工具 以下內容根據所提 26 條「高效提示工程」技巧,逐條以條列式擴充說明,並給出 2 個實例。每條均用繁體中文撰寫,避免表格,方便直接套用。 無須客套,開門見山 說明:LLM 不會因為「請、謝謝」而表現更好,反而可能讓語句變得冗長。 例 1 ❌「請問
Thumbnail
Notebook LM 最強大的 AI 學習工具 以下內容根據所提 26 條「高效提示工程」技巧,逐條以條列式擴充說明,並給出 2 個實例。每條均用繁體中文撰寫,避免表格,方便直接套用。 無須客套,開門見山 說明:LLM 不會因為「請、謝謝」而表現更好,反而可能讓語句變得冗長。 例 1 ❌「請問
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News