前言
AI 大躍進時代,網頁應用的受眾從本來的活生生的使用者,逐漸轉向冷冰冰的 AI 代理。趨勢如此,本來的網頁輸出結構為了要滿足人的需求,那些厚重,描述性、裝飾性的動效就顯的多餘,用燃燒昂貴的 LLM token解析這些累贅的 HTML 也不符合經濟原則,因此誕生了 Agent Browser,從根本解決給 AI Agent 獲取資訊的需求,透過輕量化的返回結構,讓 AI Agent 能有效迅速的尋找定位資訊,以下就展開說明
安裝
官方 GitHub 連結https://github.com/vercel-labs/agent-browser
先安裝通用作業系統服務(以 Mac 為例)
npm install -g agent-browser
確認安裝成功
agent-browser --help
然後安裝對應的 SKILL
npx skills add vercel-labs/agent-browser
重新進入 Claude Code 就能看到對應的 Skills

使用前後比較
以前一篇內部服務的負載儀表板為例,使用前就是你我熟知的 HTML

使用後全面 CLI 化

這是說明的範例,先用 open 打開頁面,然候用 snapshot 萃取元素,再做後續的點擊的跟處理,例如
- 開啟: open

- 取得元素清單:snapshot

- 想怎麼樣就怎麼樣
跟 Claude Code 整合
到這邊就簡單了,一樣用自然語言或者指定 agent browser 技能,讓它去"看"網頁,或者執行 apply 過程中,LLM 自己知道有這技能,就自己驗證完成閉環了


結語
LLM 是有點聰明的大腦,要讓他多做點事就要多教他一點能耐,網頁爬取閱讀是其中資料獲取來源的重中之重,透過 Agent Browser 就能讓 LLM 更輕鬆愉快接上 WWW 的世界級數據庫。
再延伸一點想像,有腦子會處理,會幫我們寫程式,有手腳可以拿到網路世界的資料,就形成完美的懶人閉環,開發測試一手包,離懶人開發的理想目標就更近了!


























