2026-04-17 AI news Notes

2026/04/28 更新2026/04/17 發佈閱讀 8 分鐘

OpenAI｜GPT-5.4-Cyber

Trusted access for the next era of cyber defense | OpenAI
OpenAI公布GPT 5.4-Cyber，開放更多資安人員使用 | iThome
回應 Anthropic 資安布局，OpenAI 發表 GPT-5.4-Cyber 新模型 | TechNews 科技新報

OpenAI 不是丟一個資安模型
而是把 GPT-5.4-Cyber 放進 Trusted Access for Cyber 這套框架裡

不是每個人都直接拿到同樣的 cyber 能力
而是開始走能力 + 身分驗證 + 分級存取這種部署方式
最高 tier 的已驗證防禦方才會拿到 GPT-5.4-Cyber

特別為 defensive cybersecurity fine-tune對合法資安工作更 permissive，也明講支援 binary reverse engineering，讓資安人員在沒有原始碼時也能分析編譯後軟體、惡意程式風險與漏洞

不是「又一個新模型」
而是高風險資安能力開始被做成可控開放的產品模式

Google Chrome｜Skills in Chrome

Turn your best AI prompts into one-click tools in Chrome | Google
Google在Chrome導入Skills，將AI提示轉為可重複執行的工作流程 | iThome

Chrome Skills 就是
平常在 Gemini in Chrome 裡常用的 prompt，存成可以重複執行的「一鍵工具」
=> prompt 不再只是一次性對話，而是開始變成可重複使用的 workflow

作法: 可以從 chat history 把 prompt 存成 Skill

之後在任何頁面叫出來執行還能跨多個 tabs 一起跑，另外 Google 也放了一個現成的 Skills library 可以直接拿來改

桌面版 Gemini in Chrome
支援 Mac、Windows、ChromeOS，但 Chrome 語言要設成 English-US

Chrome 正在把 prompt 產品化成「瀏覽器裡可重複執行的小工具」

Cursor × NVIDIA｜Multi-Agent Kernels

利用多代理系統將 GPU kernel 加速 38% | Cursor
SOL-ExecBench: Speed-of-Light Benchmarking for Real-World GPU Kernels Against Hardware Limits | arXiv

GPU kernel 加速 38%
且它在證明：multi-agent 已經可以碰很硬的低階工程最佳化問題

NVIDIA 的 SOL-ExecBench
是從 124 個正式與新興 AI 模型裡抽出 235 個真實 kernel 最佳化問題

重點不是單一 agent 一路寫到底，而是有 planner 去分派、重平衡工作，worker agents 再自己測試、除錯、最佳化，形成自動迭代循環

agent system 已經開始往 kernel / compiler / benchmark 門檻場景延伸

Gemini Robotics-ER 1.6｜Embodied Reasoning

Gemini Robotics-ER 1.6: Enhanced Embodied Reasoning | Google DeepMind

Gemini Robotics-ER 1.6 不是低階控制模型
比較像是機器人的高階 reasoning 腦

負責做 視覺 / 空間理解、任務規劃、成功判定

而且可以原生呼叫 Google Search、VLA 模型或其他第三方函式

三個點:

pointing / spatial reasoning 更強，連 counting、關係判斷也一起進步
multi-view success detection，也就是能整合多個相機視角判斷事情到底有沒有真的完成
instrument reading，能讀壓力表、液位計、數位讀值，這是和 Boston Dynamics 合作時挖到的重要場景

還有 instrument reading 因為它不是單純 OCR

而是 agentic vision + code execution：
先 zoom in，再用 pointing 找刻度和指針，接著用程式估比例與區間，最後再結合世界知識解讀

這代表 embodied AI 已經開始碰到更像工業現場的真實推理任務

不只是「機器人看得更懂」
而是開始具備比較像 agent 的觀察、判斷、驗證能力

Anthropic｜Mythos / Project Glasswing

Project Glasswing | Anthropic
Anthropic co-founder confirms the company briefed the Trump administration on Mythos | TechCrunch

Anthropic 不是把 Mythos 公開
而是把 Claude Mythos Preview 以 gated research preview 的方式，先交給關鍵基礎設施相關夥伴和額外 40 多個組織做防禦用途

官方列出的 launch partners
包含 AWS、Apple、Cisco、CrowdStrike、Google、JPMorganChase、Microsoft、NVIDIA、Palo Alto Networks

最重的一句是官方自己寫的
Mythos Preview 已經找出數千個 critical infrastructure 的 zero-day vulnerabilities
所以它不是單純「coding 很強」，而是已經強到 Anthropic 必須先用受控方式釋出。

另外 Jack Clark 也公開確認，他們有向 Trump administration 簡報這個模型，代表這件事已經不只是產品新聞，而是開始進入政策與國安視角

Claude Opus 4.7

更強 instruction following（更「字面化」，舊 prompt 可能失效）
強化 multi-session memory（檔案系統層）
支援更高解析 vision + 長任務 agent 模式

Mythos 太強了開放個小的給各位玩玩

Introducing Claude Opus 4.7 \ Anthropic

Claude Code 一些更新

整合 terminal / diff / file editing
重構 desktop + multi-session

Redesigning Claude Code on desktop for parallel agents | Claude

Gemini 3.1 Flash TTS

可用自然語言控制語氣、節奏、角色
支援多角色對話 + 70+ 語言
加入 SynthID watermark（內容可驗證）

Gemini 3.1 Flash TTS: New text-to-speech AI model

含 AI 應用內容

留言

Chrouos 的空間

1會員

14內容數

隨筆紀錄

Chrouos 的空間的其他內容

2026/04/14

2026-04-14 AI news Notes

Anthropic｜Claude for Wordz, METR｜Task-Completion Time Horizons, LangChain｜Agent Harness = Memory Ownership, MiniMax｜M2.7 開源釋出

2026/04/14

2026-04-14 AI news Notes

Anthropic｜Claude for Wordz, METR｜Task-Completion Time Horizons, LangChain｜Agent Harness = Memory Ownership, MiniMax｜M2.7 開源釋出

2026/04/10

2026-04-10 AI news Notes

Meta: Muse Spark, TorchTPU, Anthropic｜Claude Managed Agents

2026/04/10

2026-04-10 AI news Notes

Meta: Muse Spark, TorchTPU, Anthropic｜Claude Managed Agents

2026/04/08

2026-04-08 AI news Notes

OpenAI Image V2, Meta Avocado & Mango, Netflix VOID, GEO

2026/04/08

2026-04-08 AI news Notes

OpenAI Image V2, Meta Avocado & Mango, Netflix VOID, GEO

#AI 的其他內容

《穿著Prada的惡魔2》(The Devil Wears Prada 2) - 致我們這群過時的人

Kelvin價值投資研究室

電力基建是支撐 AI 發展最重要的關鍵

你可能也想看

Amily的沙龍

北藝嚴選指南：從兒童藝術節到國際共製，聰明玩家的 75 折選戲術

當時間變少之後，看戲反而變得更加重要——這是在成為母親之後，我第一次誠實地面對這一件事：我沒有那麼多的晚上，可以任性地留給自己了。看戲不再只是「今天有沒有空」，而是牽動整個週末的結構，誰應該照顧孩子，我該在什麼時間回到家，隔天還有沒有精神帶小孩⋯⋯於是，我不得不學會一件以前並不擅長的事：挑選。

#北藝嚴選指南#兒童藝術節#臺北表演藝術中心

2026/04/20

Amily的沙龍

北藝嚴選指南：從兒童藝術節到國際共製，聰明玩家的 75 折選戲術

#北藝嚴選指南#兒童藝術節#臺北表演藝術中心

2026/04/20

方格子 vocus 官方沙龍

🏝️ 方格創作島｜【創作地圖組】全攻略：解鎖靈感，再抽精美家電 ദ്ദി(•̀ ᗜ <)

5 月，方格創作島正式開島。這是一趟 28 天的創作旅程。活動期間，每週都會有新的任務地圖與陪跑計畫，從最簡單的帳號使用、沙龍建立，到帶著你從一句話、一張照片開始，一步一步找到屬於自己的創作節奏。不需要長篇大論，不需要完美的文筆，只需要帶上你今天的日常，就可以出發。征服創作島，抱回靈感與大獎！

#創作#vocus#方格創作島

2026/04/23

方格子 vocus 官方沙龍

🏝️ 方格創作島｜【創作地圖組】全攻略：解鎖靈感，再抽精美家電 ദ്ദി(•̀ ᗜ <)

#創作#vocus#方格創作島

2026/04/23

牧牧的成長實驗室

🧠 Gemini AI 2.5 Flash × Deep Research 全攻略

🧠 Gemini AI 2.5 Flash × Deep Research 全攻略一鍵整理資料、多輪思考，讓研究與寫作高效進化！ 🔍 為什麼選 Gemini 2.5 Flash？ Gemini 2.5 Flash 是 Google 推出的高速、大記憶、多資料理解的 AI 模型，特別適合

#成長#日常#智慧

2025/08/25

牧牧的成長實驗室

🧠 Gemini AI 2.5 Flash × Deep Research 全攻略

#成長#日常#智慧

2025/08/25

產品人來信

應用層產品的生存挑戰：Notion AI會議記錄還在Beta階段，ChatGPT就上線同類服務 | 產品人來信

ChatGPT推出錄製模式，直接錄製會議、產生逐字稿和摘要，速度遠勝仍在Beta階段的Notion AI會議記錄。此現象凸顯應用層產品仰賴外部模型的風險，一旦原廠直接進場，應用層產品的優勢將迅速被超越。本文分析兩者差異，並探討應用層產品如何在競爭中生存。

#產品#用戶#商業思維

2025/09/03

產品人來信

應用層產品的生存挑戰：Notion AI會議記錄還在Beta階段，ChatGPT就上線同類服務 | 產品人來信

#產品#用戶#商業思維

2025/09/03

釀電影，啜一口電影的美好。

往霧的更深處去──從《白色說書人》看轉型正義，與白色恐怖影視文本

見諸參與鄧伯宸口述，鄧湘庭於〈那個大霧的時代〉記述父親回憶，鄧伯宸因故遭受牽連，而案件核心的三人，在鄧伯宸記憶裡：「成立了成大共產黨，他們製作了五星徽章，印刷共產黨宣言——刻鋼板的——他們收集中共空飄的傳單，以及中國共產黨中央委員會有關文化大革命決議文的英文打字稿，另外還有手槍子彈十發。」

#釀電影#釀藝評#藝術評論

2026/05/07

釀電影，啜一口電影的美好。

往霧的更深處去──從《白色說書人》看轉型正義，與白色恐怖影視文本

#釀電影#釀藝評#藝術評論

2026/05/07

HOVA台灣視覺希望協會的沙龍

讀懂空氣的 AI 眼：在這個過度修飾的世界，我用 AI 找回「膚淺」的權利

1. 當你們忙著用 AI 拚完美，我卻用它來「打發時間」最近我的社群版面幾乎被 Google 的新玩具給洗版了。朋友們都在驚嘆：NotebookLM 現在竟然能一鍵生成精美的簡報投影片，不用再熬夜做 PPT；或是那個名字聽起來很好吃的 Nano Banana 模型，終於能畫出繁體中文不再亂碼

#Google#Note#空氣

2025/11/27

HOVA台灣視覺希望協會的沙龍

讀懂空氣的 AI 眼：在這個過度修飾的世界，我用 AI 找回「膚淺」的權利

#Google#Note#空氣

2025/11/27

釀電影，啜一口電影的美好。

《傳奇：帕拉贊諾夫的十段殘篇》：流動、跨域、變形的「生存之道」

當代名導基里爾．賽勒布倫尼科夫身兼電影、劇場與歌劇導演，其作品流動著強烈的反叛與詩意。在俄烏戰爭爆發後，他持續以創作回應專制體制的壓迫。《傳奇：帕拉贊諾夫的十段殘篇》致敬蘇聯電影大師帕拉贊諾夫。本文作者透過媒介本質的分析，解構賽勒布倫尼科夫如何利用影劇雙棲的特質，在荒謬世道中尋找藝術的「生存之道」。

#釀電影#釀評論#藝術評論

2026/02/28