HY-World 2.0
https://huggingface.co/tencent/HY-World-2.0/blob/main/README_zh.md
授權允許商業使用
官方 License 明寫授權 territory 排除 EU、英國、韓國,而且也禁止拿 HY-World 2.0 或其輸出去改進其他 AI model。 (License.txt · tencent/HY-World-2.0 at main)
Nvidia | Lyra 2.0
Nvidia 發布 Lyra 2.0:一張圖生成可探索 3D 世界,破解空間失憶與時序漂移 訓練世界模型 | 動區動趨-最具影響力的區塊鏈新聞媒體
nvidia/Lyra-2.0 · Hugging Face
14B、基於 WAN-14B
輸入是一張 480×832 圖像與相機軌跡,輸出為可即時渲染的 3D Gaussian scene
把一張圖片變成一個可以探索的 3D 世界 的模型
先依照相機路徑生成一段可漫遊的 walkthrough video,再把這些內容提升成 3D Gaussian scene,最後還能再轉成 mesh,用在即時渲染或模擬環境裡。官方專案頁直接把它定位成 explorable generative 3D worlds。
單張輸入圖 → 指定相機移動路徑 → 生成長距離探索影片 → 重建成 3D Gaussians / meshes
Nemotron OCR V2
NVIDIA 放出的 OCR 模型
用 1200 萬張合成訓練圖片把非英文語言的 NED 從 0.56–0.92 降到 0.035–0.069並在單張 A100 達到 34.7 pages/sec
細節補充:
- tokens 從 v1 的 855 個字元擴展到 14,244 個
- 涵蓋英、中、日、韓、俄,不需要先做語言偵測
- 架構用 shared detection backbone 同時服務 recognizer 和 relational model,避免重複計算
- relational model 專門處理多欄排版、表格、閱讀順序等結構問題
- 速度約是 PaddleOCR 的 29 倍、EasyOCR 的 87 倍
- 模型和資料集都已開源,授權為 NVIDIA Open Model License + CC-BY-4.0
Zen MCP Server
NVIDIA Nemotron OCR v2: 34.7 pages per second, five languages in one model, 28x faster than PaddleOCR | 24 AI
Building a Fast Multilingual OCR Model with Synthetic Data
Vercel 被入侵
據 Vercel 官方說明,事件起於 Context.ai 這個第三方 AI 工具遭入侵
攻擊者之後利用其 Google Workspace OAuth app,接管一名 Vercel 員工的 Google Workspace 帳號,並進一步進入部分 Vercel 內部環境。
Vercel Breach Tied to Context AI Hack Exposes Limited Customer Credentials
Help Net Security
外部研究指出,Context.ai 一名員工可能在 2026 年 2 月感染 Lumma Stealer(疑似與 Roblox 外掛/作弊腳本有關),進而造成公司憑證與 OAuth token 外洩,並觸發後續供應鏈升級
非 Vercel 官方直接確認 Trend Micro
- Vercel 並非 Context.ai 的正式客戶,而是至少一名員工用 Vercel 企業帳號登入 Context AI Office Suite,並授予了「Allow All」權限。
- 受影響的是 limited subset of customers 的非 sensitive 環境變數;
標記為 sensitive 的環境變數以不可讀方式保存,官方目前沒有證據顯示其值被讀取。 - 有人以 ShinyHunters 名義宣稱負責並兜售資料,但外部分析認為該身分可能是冒名;
外媒另報導其開價約 200 萬美元。
CoinDesk
Vercel April 2026 security incident | Vercel Knowledge Base
AI Agent 除了能力在成長、還有成本
模型的小時成本已逐漸逼近人力成本,能力邊界和經濟可行性正在分叉
如果 agent 每次成功的成本隨任務長度指數上升,而人力成本線性成長,就會產生一條尖銳的可行性邊界,單靠降價無法有效移動這條線 。
=> 光靠模型降價解決不了問題,根本要靠任務 horizon 本身(可靠度)的提升
METR 的 2025 年資料顯示,最佳 agent 的 50% 成功時間 horizon 約 2.5–5 小時
且每 7 個月翻倍,但成本也跟著指數成長這對 agent productization 的定價和商業模式設計影響很大
Effective Altruism Forum
Are the Costs of AI Agents Also Rising Exponentially? — Toby Ord
Kimi K2.6
Moonshot AI 在 2026 年 4 月推出的 Kimi 系列
主打長流程 coding、agent 工具調用,以及原生多模態能力
特別強調比前代在長時間寫程式、指令遵循、自我修正,以及複雜軟體工程任務上更穩。它支援文字、圖片、影片輸入,也同時支援一般對話與 agent 任務。
MoE 架構、總參數 1T、啟用參數 32B、context length 256K
K2.6 的 thinking/reasoning 預設是開著的
做多輪 tool calling,官方文件要求要正確保留reasoning_content,否則某些第三方框架可能會報錯
Qwen3.6-Max-Preview
Qwen 在 2026 年 4 月釋出的下一代旗艦模型早期預覽版
主打更強的 agentic coding、世界知識、指令遵循
Qwen 也在走封閉旗艦化
目前定位就是 preview 版旗艦模型,可在 Qwen Studio 體驗 (proprietary model)
(但因為是 Preview,也代表它還在持續調整,不算最終穩定定版)
這次的有點潦草筆記
















