OpenAI|GPT-5.4-Cyber
Trusted access for the next era of cyber defense | OpenAI
OpenAI公布GPT 5.4-Cyber,開放更多資安人員使用 | iThome
回應 Anthropic 資安布局,OpenAI 發表 GPT-5.4-Cyber 新模型 | TechNews 科技新報
OpenAI 不是丟一個資安模型
而是把 GPT-5.4-Cyber 放進 Trusted Access for Cyber 這套框架裡
不是每個人都直接拿到同樣的 cyber 能力
而是開始走 能力 + 身分驗證 + 分級存取 這種部署方式
最高 tier 的已驗證防禦方才會拿到 GPT-5.4-Cyber
特別為 defensive cybersecurity fine-tune對合法資安工作更 permissive,也明講支援 binary reverse engineering,讓資安人員在沒有原始碼時也能分析編譯後軟體、惡意程式風險與漏洞
不是「又一個新模型」
而是高風險資安能力開始被做成 可控開放 的產品模式
Google Chrome|Skills in Chrome
Turn your best AI prompts into one-click tools in Chrome | Google
Google在Chrome導入Skills,將AI提示轉為可重複執行的工作流程 | iThome
Chrome Skills 就是
平常在 Gemini in Chrome 裡常用的 prompt,存成可以重複執行的「一鍵工具」
=> prompt 不再只是一次性對話,而是開始變成可重複使用的 workflow
作法: 可以從 chat history 把 prompt 存成 Skill
之後在任何頁面叫出來執行還能跨多個 tabs 一起跑,另外 Google 也放了一個現成的 Skills library 可以直接拿來改
桌面版 Gemini in Chrome
支援 Mac、Windows、ChromeOS,但 Chrome 語言要設成 English-US
Chrome 正在把 prompt 產品化成「瀏覽器裡可重複執行的小工具」
Cursor × NVIDIA|Multi-Agent Kernels
利用多代理系統將 GPU kernel 加速 38% | Cursor
SOL-ExecBench: Speed-of-Light Benchmarking for Real-World GPU Kernels Against Hardware Limits | arXiv
GPU kernel 加速 38%
且它在證明:multi-agent 已經可以碰很硬的低階工程最佳化問題
NVIDIA 的 SOL-ExecBench
是從 124 個正式與新興 AI 模型 裡抽出 235 個真實 kernel 最佳化問題
重點不是單一 agent 一路寫到底,而是有 planner 去分派、重平衡工作,worker agents 再自己測試、除錯、最佳化,形成自動迭代循環
agent system 已經開始往 kernel / compiler / benchmark 門檻場景延伸
Gemini Robotics-ER 1.6|Embodied Reasoning
Gemini Robotics-ER 1.6: Enhanced Embodied Reasoning | Google DeepMind
Gemini Robotics-ER 1.6 不是低階控制模型
比較像是機器人的高階 reasoning 腦
負責做 視覺 / 空間理解、任務規劃、成功判定
而且可以原生呼叫 Google Search、VLA 模型 或其他第三方函式
三個點:
- pointing / spatial reasoning 更強,連 counting、關係判斷也一起進步
- multi-view success detection,也就是能整合多個相機視角判斷事情到底有沒有真的完成
- instrument reading,能讀壓力表、液位計、數位讀值,這是和 Boston Dynamics 合作時挖到的重要場景
還有 instrument reading 因為它不是單純 OCR
而是 agentic vision + code execution:
先 zoom in,再用 pointing 找刻度和指針,接著用程式估比例與區間,最後再結合世界知識解讀
這代表 embodied AI 已經開始碰到更像工業現場的真實推理任務
不只是「機器人看得更懂」
而是開始具備比較像 agent 的觀察、判斷、驗證能力
Anthropic|Mythos / Project Glasswing
Project Glasswing | Anthropic
Anthropic co-founder confirms the company briefed the Trump administration on Mythos | TechCrunch
Anthropic 不是把 Mythos 公開
而是把 Claude Mythos Preview 以 gated research preview 的方式,先交給關鍵基礎設施相關夥伴和額外 40 多個組織做防禦用途
官方列出的 launch partners
包含 AWS、Apple、Cisco、CrowdStrike、Google、JPMorganChase、Microsoft、NVIDIA、Palo Alto Networks
最重的一句是官方自己寫的
Mythos Preview 已經找出數千個 critical infrastructure 的 zero-day vulnerabilities
所以它不是單純「coding 很強」,而是已經強到 Anthropic 必須先用受控方式釋出。
另外 Jack Clark 也公開確認,他們有向 Trump administration 簡報這個模型,代表這件事已經不只是產品新聞,而是開始進入政策與國安視角
Claude Opus 4.7
- 更強 instruction following(更「字面化」,舊 prompt 可能失效)
- 強化 multi-session memory(檔案系統層)
- 支援更高解析 vision + 長任務 agent 模式
Mythos 太強了開放個小的給各位玩玩
Introducing Claude Opus 4.7 \ Anthropic
Claude Code 一些更新
整合 terminal / diff / file editing
重構 desktop + multi-session
Redesigning Claude Code on desktop for parallel agents | Claude
Gemini 3.1 Flash TTS
- 可用自然語言控制語氣、節奏、角色
- 支援多角色對話 + 70+ 語言
- 加入 SynthID watermark(內容可驗證)

















