2026-04-22 AI news Notes

更新 發佈閱讀 8 分鐘

HY-World 2.0

https://huggingface.co/tencent/HY-World-2.0/blob/main/README_zh.md

授權允許商業使用
官方 License 明寫授權 territory 排除 EU、英國、韓國,而且也禁止拿 HY-World 2.0 或其輸出去改進其他 AI model。 (License.txt · tencent/HY-World-2.0 at main)




Nvidia | Lyra 2.0

Nvidia 發布 Lyra 2.0:一張圖生成可探索 3D 世界,破解空間失憶與時序漂移 訓練世界模型 | 動區動趨-最具影響力的區塊鏈新聞媒體
nvidia/Lyra-2.0 · Hugging Face

14B、基於 WAN-14B
輸入是一張 480×832 圖像與相機軌跡,輸出為可即時渲染的 3D Gaussian scene

把一張圖片變成一個可以探索的 3D 世界 的模型
先依照相機路徑生成一段可漫遊的 walkthrough video,再把這些內容提升成 3D Gaussian scene,最後還能再轉成 mesh,用在即時渲染或模擬環境裡。官方專案頁直接把它定位成 explorable generative 3D worlds

單張輸入圖 → 指定相機移動路徑 → 生成長距離探索影片 → 重建成 3D Gaussians / meshes


Nemotron OCR V2

NVIDIA 放出的 OCR 模型
用 1200 萬張合成訓練圖片把非英文語言的 NED 從 0.56–0.92 降到 0.035–0.069並在單張 A100 達到 34.7 pages/sec

細節補充:

  • tokens 從 v1 的 855 個字元擴展到 14,244 個
  • 涵蓋英、中、日、韓、俄,不需要先做語言偵測
  • 架構用 shared detection backbone 同時服務 recognizer 和 relational model,避免重複計算
  • relational model 專門處理多欄排版、表格、閱讀順序等結構問題
  • 速度約是 PaddleOCR 的 29 倍、EasyOCR 的 87 倍
  • 模型和資料集都已開源,授權為 NVIDIA Open Model License + CC-BY-4.0

Zen MCP Server
NVIDIA Nemotron OCR v2: 34.7 pages per second, five languages in one model, 28x faster than PaddleOCR | 24 AI
Building a Fast Multilingual OCR Model with Synthetic Data


Vercel 被入侵

據 Vercel 官方說明,事件起於 Context.ai 這個第三方 AI 工具遭入侵
攻擊者之後利用其 Google Workspace OAuth app,接管一名 Vercel 員工的 Google Workspace 帳號,並進一步進入部分 Vercel 內部環境。

Vercel Breach Tied to Context AI Hack Exposes Limited Customer Credentials
Help Net Security

外部研究指出,Context.ai 一名員工可能在 2026 年 2 月感染 Lumma Stealer(疑似與 Roblox 外掛/作弊腳本有關),進而造成公司憑證與 OAuth token 外洩,並觸發後續供應鏈升級

非 Vercel 官方直接確認 Trend Micro

  • Vercel 並非 Context.ai 的正式客戶,而是至少一名員工用 Vercel 企業帳號登入 Context AI Office Suite,並授予了「Allow All」權限。
  • 受影響的是 limited subset of customers 的非 sensitive 環境變數;
    標記為 sensitive 的環境變數以不可讀方式保存,官方目前沒有證據顯示其值被讀取。
  • 有人以 ShinyHunters 名義宣稱負責並兜售資料,但外部分析認為該身分可能是冒名;
    外媒另報導其開價約 200 萬美元。

CoinDesk
Vercel April 2026 security incident | Vercel Knowledge Base


AI Agent 除了能力在成長、還有成本

模型的小時成本已逐漸逼近人力成本,能力邊界和經濟可行性正在分叉
如果 agent 每次成功的成本隨任務長度指數上升,而人力成本線性成長,就會產生一條尖銳的可行性邊界,單靠降價無法有效移動這條線 。

=> 光靠模型降價解決不了問題,根本要靠任務 horizon 本身(可靠度)的提升

METR 的 2025 年資料顯示,最佳 agent 的 50% 成功時間 horizon 約 2.5–5 小時
且每 7 個月翻倍,但成本也跟著指數成長這對 agent productization 的定價和商業模式設計影響很大

Effective Altruism Forum
Are the Costs of AI Agents Also Rising Exponentially? — Toby Ord


Kimi K2.6

Moonshot AI 在 2026 年 4 月推出的 Kimi 系列
主打長流程 coding、agent 工具調用,以及原生多模態能力

特別強調比前代在長時間寫程式、指令遵循、自我修正,以及複雜軟體工程任務上更穩。它支援文字、圖片、影片輸入,也同時支援一般對話與 agent 任務。

MoE 架構、總參數 1T、啟用參數 32B、context length 256K

K2.6 的 thinking/reasoning 預設是開著的

做多輪 tool calling,官方文件要求要正確保留 reasoning_content,否則某些第三方框架可能會報錯


Kimi K2.6 - Kimi API Platform


Qwen3.6-Max-Preview

Qwen 在 2026 年 4 月釋出的下一代旗艦模型早期預覽版
主打更強的 agentic coding、世界知識、指令遵循


Qwen 也在走封閉旗艦化
目前定位就是 preview 版旗艦模型,可在 Qwen Studio 體驗 (proprietary model)

(但因為是 Preview,也代表它還在持續調整,不算最終穩定定版)




這次的有點潦草筆記


留言
avatar-img
Chrouos 的空間
1會員
14內容數
隨筆紀錄
Chrouos 的空間的其他內容
2026/04/17
Claude Opus 4.7, Gemini 3.1 Flash TTS, OpenAI|GPT-5.4-Cyber, Google Chrome|Skills in Chrome, Anthropic|Mythos
2026/04/17
Claude Opus 4.7, Gemini 3.1 Flash TTS, OpenAI|GPT-5.4-Cyber, Google Chrome|Skills in Chrome, Anthropic|Mythos
2026/04/14
Anthropic|Claude for Wordz, METR|Task-Completion Time Horizons, LangChain|Agent Harness = Memory Ownership, MiniMax|M2.7 開源釋出
2026/04/14
Anthropic|Claude for Wordz, METR|Task-Completion Time Horizons, LangChain|Agent Harness = Memory Ownership, MiniMax|M2.7 開源釋出
2026/04/10
Meta: Muse Spark, TorchTPU, Anthropic|Claude Managed Agents
2026/04/10
Meta: Muse Spark, TorchTPU, Anthropic|Claude Managed Agents
看更多
你可能也想看
Thumbnail
當時間變少之後,看戲反而變得更加重要——這是在成為母親之後,我第一次誠實地面對這一件事:我沒有那麼多的晚上,可以任性地留給自己了。看戲不再只是「今天有沒有空」,而是牽動整個週末的結構,誰應該照顧孩子,我該在什麼時間回到家,隔天還有沒有精神帶小孩⋯⋯於是,我不得不學會一件以前並不擅長的事:挑選。
Thumbnail
當時間變少之後,看戲反而變得更加重要——這是在成為母親之後,我第一次誠實地面對這一件事:我沒有那麼多的晚上,可以任性地留給自己了。看戲不再只是「今天有沒有空」,而是牽動整個週末的結構,誰應該照顧孩子,我該在什麼時間回到家,隔天還有沒有精神帶小孩⋯⋯於是,我不得不學會一件以前並不擅長的事:挑選。
Thumbnail
當代名導基里爾.賽勒布倫尼科夫身兼電影、劇場與歌劇導演,其作品流動著強烈的反叛與詩意。在俄烏戰爭爆發後,他持續以創作回應專制體制的壓迫。《傳奇:帕拉贊諾夫的十段殘篇》致敬蘇聯電影大師帕拉贊諾夫。本文作者透過媒介本質的分析,解構賽勒布倫尼科夫如何利用影劇雙棲的特質,在荒謬世道中尋找藝術的「生存之道」。
Thumbnail
當代名導基里爾.賽勒布倫尼科夫身兼電影、劇場與歌劇導演,其作品流動著強烈的反叛與詩意。在俄烏戰爭爆發後,他持續以創作回應專制體制的壓迫。《傳奇:帕拉贊諾夫的十段殘篇》致敬蘇聯電影大師帕拉贊諾夫。本文作者透過媒介本質的分析,解構賽勒布倫尼科夫如何利用影劇雙棲的特質,在荒謬世道中尋找藝術的「生存之道」。
Thumbnail
見諸參與鄧伯宸口述,鄧湘庭於〈那個大霧的時代〉記述父親回憶,鄧伯宸因故遭受牽連,而案件核心的三人,在鄧伯宸記憶裡:「成立了成大共產黨,他們製作了五星徽章,印刷共產黨宣言——刻鋼板的——他們收集中共空飄的傳單,以及中國共產黨中央委員會有關文化大革命決議文的英文打字稿,另外還有手槍子彈十發。」
Thumbnail
見諸參與鄧伯宸口述,鄧湘庭於〈那個大霧的時代〉記述父親回憶,鄧伯宸因故遭受牽連,而案件核心的三人,在鄧伯宸記憶裡:「成立了成大共產黨,他們製作了五星徽章,印刷共產黨宣言——刻鋼板的——他們收集中共空飄的傳單,以及中國共產黨中央委員會有關文化大革命決議文的英文打字稿,另外還有手槍子彈十發。」
Thumbnail
🚀 《看不懂的論文 PDF?丟進 NotebookLM 不只看得懂還能自動做簡報!》使用教學懶人包 如果你也常遇到這種情況: 老師 / 主管丟一份 40 頁 PDF,要你明天報告 研究方法每一段都像天書 圖、表、公式多到懷疑人生 一看就想睡,越看越看不懂 那 NotebookL
Thumbnail
🚀 《看不懂的論文 PDF?丟進 NotebookLM 不只看得懂還能自動做簡報!》使用教學懶人包 如果你也常遇到這種情況: 老師 / 主管丟一份 40 頁 PDF,要你明天報告 研究方法每一段都像天書 圖、表、公式多到懷疑人生 一看就想睡,越看越看不懂 那 NotebookL
Thumbnail
5 月,方格創作島正式開島。這是一趟 28 天的創作旅程。活動期間,每週都會有新的任務地圖與陪跑計畫,從最簡單的帳號使用、沙龍建立,到帶著你從一句話、一張照片開始,一步一步找到屬於自己的創作節奏。不需要長篇大論,不需要完美的文筆,只需要帶上你今天的日常,就可以出發。征服創作島,抱回靈感與大獎!
Thumbnail
5 月,方格創作島正式開島。這是一趟 28 天的創作旅程。活動期間,每週都會有新的任務地圖與陪跑計畫,從最簡單的帳號使用、沙龍建立,到帶著你從一句話、一張照片開始,一步一步找到屬於自己的創作節奏。不需要長篇大論,不需要完美的文筆,只需要帶上你今天的日常,就可以出發。征服創作島,抱回靈感與大獎!
Thumbnail
Notebook LM 最強大的 AI 學習工具 以下內容根據所提 26 條「高效提示工程」技巧,逐條以條列式擴充說明,並給出 2 個實例。每條均用繁體中文撰寫,避免表格,方便直接套用。 無須客套,開門見山 說明:LLM 不會因為「請、謝謝」而表現更好,反而可能讓語句變得冗長。 例 1 ❌「請問
Thumbnail
Notebook LM 最強大的 AI 學習工具 以下內容根據所提 26 條「高效提示工程」技巧,逐條以條列式擴充說明,並給出 2 個實例。每條均用繁體中文撰寫,避免表格,方便直接套用。 無須客套,開門見山 說明:LLM 不會因為「請、謝謝」而表現更好,反而可能讓語句變得冗長。 例 1 ❌「請問
Thumbnail
1. 當你們忙著用 AI 拚完美,我卻用它來「打發時間」 最近我的社群版面幾乎被 Google 的新玩具給洗版了。 朋友們都在驚嘆:NotebookLM 現在竟然能一鍵生成精美的簡報投影片,不用再熬夜做 PPT;或是那個名字聽起來很好吃的 Nano Banana 模型,終於能畫出繁體中文不再亂碼
Thumbnail
1. 當你們忙著用 AI 拚完美,我卻用它來「打發時間」 最近我的社群版面幾乎被 Google 的新玩具給洗版了。 朋友們都在驚嘆:NotebookLM 現在竟然能一鍵生成精美的簡報投影片,不用再熬夜做 PPT;或是那個名字聽起來很好吃的 Nano Banana 模型,終於能畫出繁體中文不再亂碼
Thumbnail
Google 發布 Gemini 3 Pro Image(Nano Banana Pro),強調更穩定的圖生圖能力、清晰多語文字生成、可接 Search 的真實資訊,以及更完整的安全與版權標記(SynthID+C2PA)。支援最高 4K 解析度
Thumbnail
Google 發布 Gemini 3 Pro Image(Nano Banana Pro),強調更穩定的圖生圖能力、清晰多語文字生成、可接 Search 的真實資訊,以及更完整的安全與版權標記(SynthID+C2PA)。支援最高 4K 解析度
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News