一、內部溝通成本
一開始我們在安裝 OpenClaw 的時候,是選擇 Google/Gemini 的免費服務,但是很快地就會發現使用額度 (也就是所謂的 Token 數) 很快就會超過,然後 OpenClaw 就會死當;像這樣子的畫面:

- 綜觀
「內部溝通成本」指的是 OpenClaw 必須要能夠聽得懂你講的話,並了解要如何應對。這時候它就必須要有一個自然語言的引擎以及相對的回覆機制,這些引擎就包括就像 Open AI 、Google/Gemini、Antropic/Claude 或是中國的 DeekSeek、阿里巴巴的 Qwen 以及新竄起的 MiniMax 及Kimi;當然如果不使用付費的方案,可以使用 Local 端的像是Ollama 人工智慧模型。這個模型會決定 OpenClaw 跟你的互動是不是夠聰明;如果模型做得不好,你會發現跟 OpenClaw 的對話就像是對牛彈琴,也就完全失去了 AI 助理的意義了。
- Google Gemini 的計費方式
以 Gemini 為例,一開始我們採用他的「free tier」版本,來取得他的 API key 進行安裝;之後遇到死當的問題,就將它升級為「paid teir1」。先讓 OpenClaw 活過來 (可以跟小蝦 say Hello,確定小蝦沒問題)。再來,我們來看一起 Gemini 的計費方式。

Gemini 的付費方式是用多少 token 給多少錢,依照不同的模型有不同的價格,感覺蠻合理的,但如果我們只有固定的預算,這樣的計費方法會不斷地增加成本,直到限額的上限。在設定上 Gemini 的 paid tier 1 的限額就是 250 美元;如果,超過每月限額就會自動停止,另外還會附帶一個瞬間使用量 (TPM/每分鐘使用量 或 TPS/每秒使用量) 的限制,超過瞬間使用量則會暫時停止;不過,這個 Gemini 的價格即使是 tier 1 的限額的金額也算是很高,遠超過我原來預想的 10 美元。還好 Gemini 有提供一個成本報表,可以看到目前的狀態,例如設定每個月的限額新台幣 300 元:

這個報表在超過限額之後,並不會強制停止,也不會自動送出通知;所以,使用的時候要自己去注意。像我在這段跟 OpenClaw 一起學習的階段,跟 OpenClaw 有很多互動,這個 10 美金的預算限額很快就超過了。
- MiniMax 模型的計費
所以,再去找一個可用的模型,以MiniMax的「Starter」方案為例,它有一個是每月10美元的方案,它是固定金額的扣款,只有瞬間使用量以及每 5 小時內呼叫模型總次數的限制,也就是說不管怎樣用,5 小時之後就一定可以重新恢復;算是對一般使用者相當划算的方案,我想也是 MiniMax 可以在最近快速竄起的重要原因。


- 更新 model 的步驟
在 MiniMax 網頁上有完整 OpenClaw 安裝的流程教學,不過因為我們已經裝好了 OpenClaw 只需要修改設定就可以;所以就可以請小蝦新增模型,同時也把 API 告訴他,使用 API Key 的方式,之後要作 multi-agents 或建立多人使用環境,管理上會比較方便 。
我要新增一個 model 是 Minimax, API key 是 xxxxxx
API-key 可以在 MiniMax 的網頁找到,當你註冊並購買了它的方案後 (記得要選它的 Token Plan,不然會很燒錢),"回首頁->點選自己的頭像->再點選左側 API key 選單",然後要使用右邊下方那個 "Manage Subscription" 底下的"Token Plan Key" (這個過程有點複雜,我一開始也弄錯)。

然後它會問模型的名稱,這時很重要,你要請它提供選單。

然後再按照他提供的名稱填給他,我目前使用是 "MiniMax-M2.5";如果你人在中國,就要選擇 "MiniMax-M2.5 CN"。
這時候你已經有兩個模型可以使用,如果打開 '.openclaw/openclaw.json' 可以看到有一個 default 的 model 和備用 (fallbacks) 的 model。如果需要的話,隨時可以請小蝦作模型切換。

先關掉檔案,再呼叫小蝦


這時候你就可以看到組態 (.openclaw/openclaw.json) 已經改好了。當然改完之後要重新啟動 OpenClaw 服務,這也可以請小蝦代勞。
OpenClaw 的"~/.openclaw/openclaw.json"組態檔是一個非常重要的檔案,跟模式相關的改變如果要手動變更,一定要先留備份檔。而且,因為模式的安裝很容易當機,而且模型名稱經常在改變,openclaw 的命令列指令 ("openclaw configure") 所預選的 model 列表,往往不會及時更新;如果用 "openclaw configure" 指令的話,可以先用原來接近名稱的 model 之後,再到 "openclaw.json"中去修改;像現在 MiniMax 最新的模型就是 MiniMax M2.7,名稱是"minimax-m2.7-20260318"。
- Mistral 模型的設置
MiniMax 是中國的公司,如果不方便使用的話,也可以參考其他的方案,例如法國的 Mistral AI;相對來講也是一個便宜的方案,可以設定每月的使用上限。Mistral AI 它的產品我們一般比較不熟悉,進入首頁之後會看到 "LeChat"和 "AI Studio"兩個產品,它跟我們要用的 API Key 是在 AI Studio 這一塊,我請小蝦整理如下:

它的網頁設計思維和一般習慣的美式或中式作法不太一樣;首先還是要先進入它的首頁之後,進入 Mistral AI Studio 的首頁,找到 API 的 Quictstart,然後按照上面的步驟來進行。


當你作到最後一步建立 API Key 的時候,API Key 的內容只會出現一次,你要趕快把它 copy 下來,記在你自己的記事本上;之後離開了這個畫面,你在 Mistral 網站上任何地方都找不到你建立的 Key 的內容 (自己作的東西自己保管好 );當然,如果你真的漏了記起來,就重新再建另一個 Key 就好了。整個註冊完成之後,你應該會是採用這個方案,用多少算多少。

Mistral 在最近模型更新之後,我自己手動安裝 API 都沒有成功;後來透過 OpenRouter 的 "Bring Your Own Key" 服務才完成,有興趣的話可以參考我後來有關 OpenRouter 的這篇文章。
Mistrial 符合歐洲資訊安全準則的要求,使用上在隱私感覺比較安心;它的 Mistral Small 4 在對話反應跟我自己比較對頭,會花多一些時間來回討論,不像 MiniMax 那麼諂媚,而且它的程式能力確定不錯,在一起建立或修改所需要的技能 (Skill) 的時候,效率還蠻好的。算是我目前主力使用的模型。它的付費系統上也可以設定強迫上限,而且沒有最低上限的設定上限;我就直接 10 美金。收費上,明顯是比大型美國的 AI 服務要便宜很多; 不過就沒有像 MiniMax Token Plan 幾乎是吃到飽的計價方案。

值得一提的是 Mistral NeMo 這個模型是跟 nVidia 合作的模型,專門為 Edge AI 使用;未來如果有機會的話,是很值得嘗試的模型。
- Open AI 的免費額度
自從 OpenClaw 的創辦人 Peter Steinberger 先生加入Open AI 之後,Open AI 算是對 OpenClaw 的使用者相當友善的大型 AI 公司。不但持續資助 OpenClaw 的獨立開源基金會,也對提供 OpenClaw使用者一個可以使用 GPT 5.x 最新模型的免費額度計劃。當然,加入計劃的前提是使用者同意在使用 Open AI 模型的同時,Open AI 可以將使用的過程記錄下來用來改善模型;這個選項你是可以隨時取消。我還蠻喜歡它的 Gpt-5.4 mini 這個模型,不像以前的模型那麼會唬爛;免費額度 (2.5 M tokens) 其實不大,大概是自己月均用量 1/20,不過也不無小補;好處是免費額度是以日計算。所以我是拿來當備用模型,遇到比較難的問題再把它叫出來見客。

它的計費也是分層計算,最低只要儲值 5 美金就可以開始用。不過,如果你在台灣,也可以免費就可以取得它的 API Key,再加上它的免費額度。

- Ollama 吃到飽無限調用超大型模型
- 經營模式:
講到成本不能不提 Ollama。Ollma 提供許多開源模型下載到本機端建置自己的 AI 模型;它提供完全免費的開源 AI 模型;你只要下載安裝就可以了。不過,其實現在開源模型的能力已經跟商用模型的能力不相上下,像 nVidia 也跟開源模型積極合作。再加上Google 發表了強大的 Gemma 4 系列開源模型,能力甚至超越大部份的商業模型;不過要使用這些大型模型為 openclaw 的 AI model,需要很昂貴的設備;大量的記憶體以及 GPU。不是一般人可以使用;更不用說是用在 Tokan 爆量的 OpenClaw。

- 雲端模型:
另外 Ollama 最近提供了一個讓人超級令人「驚艷」的雲端模型方案;它在雲端幫你架好 Gemma 4 31B、GPT-OSS 120B、DeepSeek v3.2、Mistral Large 3 這些超大型的 AI 模型,然後用最新的硬體來幫你跑程式;而是它的價格,郤非常親民。免費版的可以同時間使用一個模型,如果只是人工使用,不使用 AI Agent 像 OpenClaw 的話,用量應該都夠用;如果是用 OpenClaw 的建議使用 Pro 版,基本上就是手機月費吃到飽。它的計費是以模型使用 GPU 時間來計算,每五天會歸零一次重計。

- 安裝
Ollama 的付費雲端使用作法和其他 AI token provider,有點不太一樣。先進網頁登入、付費、取得 API 之後;要再下載安裝它的軟體 (ollama),安裝好之後執行
ollama signin這樣它就會在瀏覧器上顯示登入認證的畫面,鎖定電腦來使用;電腦數量上似乎沒有限制。然後你可以把你要的雲端模式拉進來;因為是雲端,基本上不佔硬碟空間,時間也是幾秒就完成。選好你要裝的模型,例如 Gemma 4 31B,把它拉進來 ollama 進就可以;因為雲端模型不佔空間,拉進來只需要幾秒時間而己。要找雲端模型的時候要記得它的模型名稱最後都有"cloud"這幾個字。
ollama pull gemma4:31b-cloud
模型裝好之後,就可以利用 openclaw 的 configure 來安裝 openclaw;選擇 Local->Model->Ollama->base URL (不改)->Local 之後,openclaw 就會真的到你的電腦上找模型;一步就幫你裝好。最後,可以自己再打開 "openclaw.json" 檢查一下,調整 default model,沒什麼問題重新啟動 openclaw 的 service 就可以了。
openclaw configureopenclaw gateway restart- 多模型使用的配置及注意事項
- 按量計費模型
OpenClaw 可以同時配置多個模型,並且設定使用順序。如果是使用按量計費的方式的話,為了避免 OpenClaw 無限地使用資源,造成成本無法控制;通常我們第一順序的選擇是具備是有硬性費用管制使用上限的模型;例如 Mistral 或 MiniMax;如果臨時需要一些比較"聰明"的問題需要解決,也可以將 Gemini 2.5 或 Gpt 5.4 min 當備份模型;只要告訴小蝦更換 model 即可切換過去就可以;因為它是有使用才需要付費,平常如果不用就是免費,像 Gpt 5.4 如果同意資料提供的話,每天還有一些免費額度可以使用。
- 訂閱計費模型
如果是使用訂閱制的話;例如,minimax 的 token project (10 美元/月) 或是 Ollama Pro (20美元/月) ,這些基本上都差不多是吃到飽方案;成本就很固定。我自己初期在學使用 openclaw 的時候,不知道怎麼控制 token 的使用量;所以就使用 minimax 的訂閱;不過目前是改用 Ollama Pro 方案。當然,如果真的要完全免費又不想花錢裝設備的話,OpenRoute 的 "openroute/free" 也可以考慮 (可參考後面的文章);只是沒有圖形輸入,使用時候比較麻煩。
- 我自己的使用情形
在模型切換的過程當中,小蝦的記憶是原則上沒有改變;所以,如果他的工作訓練都完成,不管用那一個模型,它的行為都沒什麼太大差別,差別在輸入資料、解析能力和反應時間;使用的模型要有能力聽得懂我們的談話,也就是要有足夠解析語言以及拆解工作的能力。
如果沒有公務機關資訊安全的考量的話,MiniMax 是很適合 openclaw 的模式,包括Peter Steinberger 之前也有在使用; 它的 MiniMax Token Plan, Starter 方案一般使用上,幾乎是每個月 10 美元吃到飽,缺點是只能用它們家的特定模型,另外就是中國特定法律要求造成的資安疑慮;在第一個月,我幾乎都是用他們家的。
不過因為自己的習慣會有長時間的來回討論,反應快慢倒是其次,但是 text window 就是很重要的選擇;因此就會偏向大型的模型。目前就轉到 Ollama Pro 的方案,每月 20 美元,因為它可選擇多個大型模型,包括 Gemma 4/DeepSeek v3.2/Qwen 3.5 當然也包括 MiniMax 2.7,以及最新的 GLM 5.1;可以隨時嘗新。重點是,它提供 Cogito 這個模型,在寫學術論文的時候非常好用,所以目前就是使用 Cogito v2.1 以及 Gemma 4 作「多角色」AI Agent,偶而再加上 Mistral-Large-3 寫一些 python code 和投影片;相當好用。
因為對小蝦來說,語言模型的目地是為了跟內部使用者溝通並且解析使用者的需求,它的成本來源可以是的外部付費模型,也可以是使用本地端自建免費的語言模型;是服務訂閱成本;但是如果本地端有足夠的硬體設備,也可以免費使用開源模型安裝使用,這時候的主要成本就是硬體設置成本,習慣上依使用年度攤提;按照作法不同,雖然使用同一個 AI 模型,但會有不同的成本結果。為了單純起見,我根據 AI Agent 使用需求的角度把 OpenClaw 使用模型的成本稱為「內部溝通成本」。
二、外部操作成本
在跟小蝦一起工作一段時間之後,會出現這樣的訊息。


這時候,小蝦還是在正常運作,但是原先安裝時使用 Google 搜尋的免費額度( 每天 100 次) 已經使用完了。這在一般我們人為使用 Google 功能時,幾乎是不可能發生;當然我們可以暫停工作,隔天再來進行。但是這對一個 24 小時需要工作的 AI 助理來說其實很不方便,考慮之後目前是改用"Brave" 的搜尋;它的收費基本上的 Google 是一樣的,但是少了每日使用的限制。

它是每 1000 次搜尋收 5 美金,而每個月可以優惠 5 美金,等於前 1000 次搜尋不收費;沒有每日搜尋的限制。對一般使用來說,幾乎就是免費。
安裝上,因為不影響 model,所以直接命令列安裝就可以。
openclaw configure
這裏要選擇 "web tool->Enable" 然後要改選 "Brave",貼上 API key 就完成了。

重新啟動 openclaw 服務
openclaw gateway restart然後,小蝦就可以運作了。

這方面的成本可以透過 Brave 的網站去查詢,我也是設定最高上限為 10 美金;不過,其實只是一般正常的使用,加上方案的優惠;基本上應該都是免費;這就看下個月的帳單就知道了。

基本安裝完之後,使用 OpenClaw 所需要的「外部操作成本」應該只有搜尋這項功能而己;不過,當小蝦的能力越來越強大的時候,要完成工作所需要的外部資源就會越來越多;可能就會再增加這方面的成本;畢竟大秘書的薪水總是高過工讀生。
後話
過去我們為了一些工作或研究,經常在使用像Open AI/Antropic Claude/Google Gemini 這些頂尖 AI 服務廠商以及 Google 搜尋這些市佔率最高的工具;避免廠商輸出結果的品質不符合我們的要求,或是不方便與同事或客戶溝通。但是,很難去想像使用這些工具的頻率會高到超過廠商預定的基本使用額度。但是,在使用 AI 助理的時候,這些使用的頻率幾乎是千百倍增加,我們不得不改變原來的使用習慣。反思之後,我想會造成幾種現象,而且現在已經正在發生。
- 就像最近 GTC 大會黃仁勳講的, 因為 AI Agent 的提早爆發,進入一般的使用者端;AI 的基礎建置明顯不夠,甚至不到真正需求的百分之一;單一或原來寡佔市場的廠商如果無法提供如此大規模的服務放大,新興的廠商及資本就會繼續增加;這當然影響 AI 晶片或記憶體各種大量生產的需求繼續增加。
- 服務的性價比出現。第一線的 AI 供服務廠商以前總是能以最好的品質,不管是反應速度或是答覆內容,輾壓品質稍微差一點的服務廠商;造成之前這個市場只有第一沒有第二。但是由於 AI Agent 極大量 token 使用,使用的成本會成為使用者選 AI 服務商的重要依據;也就是性價比會決定 AI 服務商的客戶數量及付費的多寡,甚至是原有的 AI 廠商不能只靠技術領先就可以在市場存活;大量的二線廠商以有效的定價策略或商業模式快速竄起。
- AI Agent 最終是一個平民化的產品,它提供的不像 Open AI/Gemini 在商業考量下,快速提供數百萬人共同可能需要的答案;而是單純個人化或家庭化智慧累積,這其實會有各別區域或社區文化的影響;比如 AI Agent 在長照上的應用,台灣有很多老人非常聰明並且高頻率地使用手機通訊軟體 (例如 LINE);可以容易地預期, 很快地 AI Agent 就會應用這個區塊,並且影響他的文化及行為,文化區域性的差別以及主權 AI 這些需求明顯地需要本土的 AI 服務商快速地建立起來。
- 從 nVidia GTC 大會、 Google Gemma 4 的發表,到 Anthropic 封鎖第三方支援這些事件的發生,不難看出來因為 AI Agent 的快速爆發,市場生存的遊戲規則已經完全改變;既使是一線的大廠都擋不住這股洪流;何其幸運可以在這個時間點,看到時代的改變,甚而參與其中。





















