Context-1

更新 發佈閱讀 5 分鐘

Chroma Context-1: Training a Self-Editing Search Agent·|·Chroma

Chroma Context-1 在做的不是一般 RAG 再加 reranker
而是一個專門負責 多步搜尋(agentic search) 的 20B 模型

⇒ retrieval subagent:不直接回答問題,只負責把最相關的文件找出來,再交給下游生成模型回答


關鍵重點

  • 訓練策略:先廣搜再精煉
  • 推論策略:搜尋途中動態清理 context
  • 資料策略:用合成任務管線擴大高品質訓練資料

1. 分階段訓練:
先 Recall,再 Precision

  1. 先訓練模型 盡量不要漏掉可能有用的資訊,也就是先偏向廣搜;
  2. 後面再訓練它 從這些候選中逐步縮小範圍,只留下真正重要的內容

模型會把大問題拆成多個 subquery,逐輪搜尋
先 recall、後 precision 的 staged curriculum

也就是先學會廣搜不要漏(可能會抓到噪音,但是漏掉關鍵文件更糟糕)再慢慢學會縮小、保留真正重要的文件


2. Context management:
搜尋過程中自己清理上下文

這個方法的重點不只是「找到更多文件」,而是 動態管理 context

Agent 會在搜尋途中持續淘汰不重要的段落,而不是無限制累積資訊,藉此避免:

  • context window 被無關內容塞滿
  • 多輪搜尋後資訊越來越雜亂
  • 舊資訊干擾後續判斷

這類現象就是文中提到的 context rot

希望展現的是模型對於管理證據與控制 context 品質的能力


3. 可擴展的 synthetic task generation pipeline

訓練上不是只靠人工資料,而是建立了一套 合成任務資料產生流程,用 LLM 來產生任務、評估品質,減少大量人工標註的需求,同時維持資料品質。

意思是:

  • 不用完全靠人工做訓練資料
  • 可以大量擴充訓練任務
  • 研究者也比較容易重現結果

訓練中最麻煩的問題之一:高品質多步搜尋資料很難人工大量標註

涵蓋 web、finance、legal、email 等場景


Agent Harness

不要讓同一個模型同時負責檢索與生成,改成用 subagent 拆工,效果可能更好

1. Context-1 不是最終回答模型,
而是 search subagent

Context-1 的工作不是直接回答使用者問題,而是替下游的 frontier reasoning model 找到支撐文件。

它負責的是:

  • 搜尋
  • 找證據
  • 整理可用文件

真正最後做綜合推理、生成答案的,還是另一個更強的 downstream model

所以它本質上是 retrieval specialist,不是 general-purpose answer model

2. 透過 tool calls 跟底層搜尋系統互動

Context-1 並不是直接「知道所有資料」
而是透過一層 search infrastructure 來查資料

它和底層系統互動的方式是:

  • model 發出一個結構化的 tool call
  • harness 代替它去執行這個 call
  • 再把結果回傳給 model

模型不是直接操作資料庫,而是透過一個受控的工具介面進行搜尋


3. 整個流程是
observe → reason → act loop

核心執行模式是一個循環:

(1) Observe
先看到目前狀態,包含先前搜尋結果或新回傳的 observation。

(2) Reason
模型根據目前拿到的資訊判斷:

  • 下一步要查什麼
  • 要不要換 query
  • 還是已經可以停止

(3) Act
模型輸出一個 tool call,或者直接給 final answer接著 harness 會真的去執行工具呼叫,再把新結果加回 trajectory,進入下一輪。

所以整體就是:
看結果 → 想下一步 → 執行搜尋 → 再看新結果

observe → infer → act 的 state machine;

搜尋時會同時做 sparse + dense retrieval,再用 RRF 融合,之後 reranker 選出符合 token budget 的結果


隨便紀錄,參考各個電子報,我只寫我在意的部分,文筆請 ChatGPT 潤飾


留言
avatar-img
Chrouos 的空間
1會員
14內容數
隨筆紀錄
Chrouos 的空間的其他內容
2026/04/06
Microsoft MAI, Gemma 4, Alibaba Qwen3.6-Plus, Bonsai(PrismML)
2026/04/06
Microsoft MAI, Gemma 4, Alibaba Qwen3.6-Plus, Bonsai(PrismML)
2026/04/02
Context-1 instructkr claw-code Datadog Redefined Data Replication Sycophantic AI decreases prosocial intentions and promotes dependence
2026/04/02
Context-1 instructkr claw-code Datadog Redefined Data Replication Sycophantic AI decreases prosocial intentions and promotes dependence
2026/03/31
Roblox Translate Meta Avocado ARC-AGI-3 上線 OpenAI砍掉Sora
2026/03/31
Roblox Translate Meta Avocado ARC-AGI-3 上線 OpenAI砍掉Sora
看更多
你可能也想看
Thumbnail
這是這篇超長的讀書筆記的最後一篇。"我的肉身雖然衰殘,我的靈卻得以擴大”寫到這裡懷特菲爾德那為神燃燒的生命,事奉完全為神擺上的那份執著都給我們留下了極大的震撼。他簡直就是一台講道的“永動機”,生命不息,戰斗不止。的的確確是一只在黑夜裡照亮別人,燃燒不停的蠟燭,直到燃盡為止。
Thumbnail
這是這篇超長的讀書筆記的最後一篇。"我的肉身雖然衰殘,我的靈卻得以擴大”寫到這裡懷特菲爾德那為神燃燒的生命,事奉完全為神擺上的那份執著都給我們留下了極大的震撼。他簡直就是一台講道的“永動機”,生命不息,戰斗不止。的的確確是一只在黑夜裡照亮別人,燃燒不停的蠟燭,直到燃盡為止。
Thumbnail
Context Engineering 是一種新興的學科,它重新定義了我們與 AI 系統互動的方式,並可能成為下一個軟體開發的重要典範轉移。與 Prompt Engineering 相比,Context Engineering 更系統化、全面,適用於各種領域,例如商業決策、醫療保健、教育和金融服務。
Thumbnail
Context Engineering 是一種新興的學科,它重新定義了我們與 AI 系統互動的方式,並可能成為下一個軟體開發的重要典範轉移。與 Prompt Engineering 相比,Context Engineering 更系統化、全面,適用於各種領域,例如商業決策、醫療保健、教育和金融服務。
Thumbnail
十七世紀末,正統主義將基督教本來活潑的信仰化成一套僵化、呆板、抽象的教理,而信心變成了對這套教理的宣認,這與當初路德所講的信心很不同,當路德談到信心時,指的是信徒與神之間活潑的關系,但到了正統主義時代,這種關系仿佛被信徒遺忘了一樣,他們擁有精細地界定所謂“純正信仰”,但卻缺乏了因信仰而來的生命活力。
Thumbnail
十七世紀末,正統主義將基督教本來活潑的信仰化成一套僵化、呆板、抽象的教理,而信心變成了對這套教理的宣認,這與當初路德所講的信心很不同,當路德談到信心時,指的是信徒與神之間活潑的關系,但到了正統主義時代,這種關系仿佛被信徒遺忘了一樣,他們擁有精細地界定所謂“純正信仰”,但卻缺乏了因信仰而來的生命活力。
Thumbnail
當時間變少之後,看戲反而變得更加重要——這是在成為母親之後,我第一次誠實地面對這一件事:我沒有那麼多的晚上,可以任性地留給自己了。看戲不再只是「今天有沒有空」,而是牽動整個週末的結構,誰應該照顧孩子,我該在什麼時間回到家,隔天還有沒有精神帶小孩⋯⋯於是,我不得不學會一件以前並不擅長的事:挑選。
Thumbnail
當時間變少之後,看戲反而變得更加重要——這是在成為母親之後,我第一次誠實地面對這一件事:我沒有那麼多的晚上,可以任性地留給自己了。看戲不再只是「今天有沒有空」,而是牽動整個週末的結構,誰應該照顧孩子,我該在什麼時間回到家,隔天還有沒有精神帶小孩⋯⋯於是,我不得不學會一件以前並不擅長的事:挑選。
Thumbnail
5 月,方格創作島正式開島。這是一趟 28 天的創作旅程。活動期間,每週都會有新的任務地圖與陪跑計畫,從最簡單的帳號使用、沙龍建立,到帶著你從一句話、一張照片開始,一步一步找到屬於自己的創作節奏。不需要長篇大論,不需要完美的文筆,只需要帶上你今天的日常,就可以出發。征服創作島,抱回靈感與大獎!
Thumbnail
5 月,方格創作島正式開島。這是一趟 28 天的創作旅程。活動期間,每週都會有新的任務地圖與陪跑計畫,從最簡單的帳號使用、沙龍建立,到帶著你從一句話、一張照片開始,一步一步找到屬於自己的創作節奏。不需要長篇大論,不需要完美的文筆,只需要帶上你今天的日常,就可以出發。征服創作島,抱回靈感與大獎!
Thumbnail
當老師說,一個藝術家需要有一個清晰的作品脈絡才能成為一個被認可的藝術家。你覺得呢?
Thumbnail
當老師說,一個藝術家需要有一個清晰的作品脈絡才能成為一個被認可的藝術家。你覺得呢?
Thumbnail
最后這一部分的讀書筆記,因著其它的寫作而耽擱下來。昨天靈修,讀到詩篇12篇時,卻讓我突然想到懷特菲爾德。我知道作為人,沒有一個是完全人。而在十八世紀的英國,世風低落,罪性往往讓人們心懷不正,人與人之間欺詐不講忠信。可是人的內心卻渴望一份正直誠信的美好生活。
Thumbnail
最后這一部分的讀書筆記,因著其它的寫作而耽擱下來。昨天靈修,讀到詩篇12篇時,卻讓我突然想到懷特菲爾德。我知道作為人,沒有一個是完全人。而在十八世紀的英國,世風低落,罪性往往讓人們心懷不正,人與人之間欺詐不講忠信。可是人的內心卻渴望一份正直誠信的美好生活。
Thumbnail
隨著 Agent 任務複雜度的提升,單純擴大上下文窗口已無法滿足需求,反而可能因計算成本和「注意力衰減」問題導致效率下降。傳統 RAG 的局限性,結合短期與長期記憶、發展情境感知檢索、上下文壓縮等策略的解決方案,對於構建更智能、更能解決複雜問題的 LLM Agent 至關重要。
Thumbnail
隨著 Agent 任務複雜度的提升,單純擴大上下文窗口已無法滿足需求,反而可能因計算成本和「注意力衰減」問題導致效率下降。傳統 RAG 的局限性,結合短期與長期記憶、發展情境感知檢索、上下文壓縮等策略的解決方案,對於構建更智能、更能解決複雜問題的 LLM Agent 至關重要。
Thumbnail
什麼是執行環境(Execution Context)? 簡單來說,執行環境是 JavaScript 程式碼執行時所在的「環境」。 它決定了程式碼如何被解析和執行,並管理變數、函數以及作用域(scope)的存取。 每當程式碼執行時,JavaScript 引擎會建立一個執行環境。
Thumbnail
什麼是執行環境(Execution Context)? 簡單來說,執行環境是 JavaScript 程式碼執行時所在的「環境」。 它決定了程式碼如何被解析和執行,並管理變數、函數以及作用域(scope)的存取。 每當程式碼執行時,JavaScript 引擎會建立一個執行環境。
Thumbnail
他是一個有著深深和無偽的謙卑的人。他是一個用燃燒的愛愛著我們主耶穌基督的人。他是一個孜孜不倦勤奮為上帝工作的人。他是一個直到生命盡頭都極為舍己的人。他是一個特別無私、目標專一的人。他是一個特別歡喜快樂的人。他在信仰上有著非同一般的愛心、寬容、慷慨。
Thumbnail
他是一個有著深深和無偽的謙卑的人。他是一個用燃燒的愛愛著我們主耶穌基督的人。他是一個孜孜不倦勤奮為上帝工作的人。他是一個直到生命盡頭都極為舍己的人。他是一個特別無私、目標專一的人。他是一個特別歡喜快樂的人。他在信仰上有著非同一般的愛心、寬容、慷慨。
Thumbnail
見諸參與鄧伯宸口述,鄧湘庭於〈那個大霧的時代〉記述父親回憶,鄧伯宸因故遭受牽連,而案件核心的三人,在鄧伯宸記憶裡:「成立了成大共產黨,他們製作了五星徽章,印刷共產黨宣言——刻鋼板的——他們收集中共空飄的傳單,以及中國共產黨中央委員會有關文化大革命決議文的英文打字稿,另外還有手槍子彈十發。」
Thumbnail
見諸參與鄧伯宸口述,鄧湘庭於〈那個大霧的時代〉記述父親回憶,鄧伯宸因故遭受牽連,而案件核心的三人,在鄧伯宸記憶裡:「成立了成大共產黨,他們製作了五星徽章,印刷共產黨宣言——刻鋼板的——他們收集中共空飄的傳單,以及中國共產黨中央委員會有關文化大革命決議文的英文打字稿,另外還有手槍子彈十發。」
Thumbnail
當代名導基里爾.賽勒布倫尼科夫身兼電影、劇場與歌劇導演,其作品流動著強烈的反叛與詩意。在俄烏戰爭爆發後,他持續以創作回應專制體制的壓迫。《傳奇:帕拉贊諾夫的十段殘篇》致敬蘇聯電影大師帕拉贊諾夫。本文作者透過媒介本質的分析,解構賽勒布倫尼科夫如何利用影劇雙棲的特質,在荒謬世道中尋找藝術的「生存之道」。
Thumbnail
當代名導基里爾.賽勒布倫尼科夫身兼電影、劇場與歌劇導演,其作品流動著強烈的反叛與詩意。在俄烏戰爭爆發後,他持續以創作回應專制體制的壓迫。《傳奇:帕拉贊諾夫的十段殘篇》致敬蘇聯電影大師帕拉贊諾夫。本文作者透過媒介本質的分析,解構賽勒布倫尼科夫如何利用影劇雙棲的特質,在荒謬世道中尋找藝術的「生存之道」。
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News