還在煩惱開源模型能不能跑？用 llmfit 一測就知道！

不知道大家有沒有這種經驗：看到一個很厲害的開源模型釋出，滿懷期待地下載到自己的電腦，結果跑起來卡到懷疑人生？或是花了大半天下載，最後發現根本跑不動，只能默默刪掉？

在本地端跑大型語言模型，最大的痛點就是：你永遠不曉得某個開源模型在自己的電腦上到底跑不跑得動、跑起來順不順、每秒能輸出多少 Token。

市面上雖然有不少像「Can I run LLM」、「Can I use LLM」這類的網站服務，號稱只要打開網頁就能幫你查詢手機或電腦能否跑某個模型。但老實說，我自己用下來的感覺是——那些數字就只是擺在那邊好看，網頁上的資料跟實際跑出來的結果落差非常大，坦白講完全沒辦法當作參考依據。

於是 llmfit 出現了

今天要跟大家介紹的是 llmfit（GitHub 連結）。這是一套免費、開源的終端機介面工具（TUI），支援 Windows、macOS 和 Linux 三大主流作業系統。你可以透過終端機指令或安裝包來安裝，安裝完成後一開啟，馬上就能知道超過 500 種開源模型在你電腦上的跑分表現。

我自己實測的心得是：llmfit 顯示的數據跟真實跑分相當接近，完全可以作為參考依據。

有了 llmfit，你不需要再花幾十分鐘甚至好幾個小時（看網路速度和模型大小）去下載一個大模型，結果好不容易跑起來卻超級卡，可能勉強能動但根本無法實際使用，最後用不到幾秒就刪掉——這種過程真的會讓人懷疑人生。

尤其現在模型釋出就像車輪戰，一個接一個一直來。如果你跟我一樣喜歡玩各種大模型、愛測試新東西，應該很能體會這種痛。

llmfit 安裝成功開啟後，它會自動偵測你當下電腦的硬體規格，完全不用手動輸入一堆參數。

預設的排序模式是 Date，也就是依照模型釋出發表的時間，從最新到最舊依序排列。比方說我錄製這篇文章的時候，DeepSeek V4 Flash 也才剛開源而已。

操作方面，你可以用鍵盤的上下鍵來切換選項，也可以用 Page Up 和 Page Down 切換分頁（因為是 TUI 終端機介面，無法用滑鼠滾輪）。另外，按 Home 鍵可以快速跳到當前排序的最後一筆（最舊的模型），按 End 鍵則可以跳到最新的一筆。

例如切換到 score，你可以快速看到考試成績最高的模型排名；切換到 tok/s，則會按照輸出速度排序。但要注意，Token 最快的模型，成績可能只有 60 幾分——就像考試寫很快但錯誤一堆，快沒有用。所以大家要依照自己的需求切換不同視角，選擇最適合自己的模型。

按斜線鍵 / 可以快速搜尋模型名稱。比如我搜尋「Qwen 3.6」，然後按 Esc 離開輸入框，再用 s 切回 Date 排序。

這裡顯示的數字，我自己親身體驗下來，真的滿準的，不是隨便寫一堆乍看好像有那麼一回事、但跟實際差很多的數字。至少我自己親自跑分測試了好幾輪、多個模型比對下來，確實是這樣。

我特別想提一個例子。請看：

如果你不知道這兩個模型的背景，看到 27B 和 35B，可能會直覺認為 27B 參數比較小、應該跑得比較快，35B 比較慢。但事實並非如此！

結果在同一台電腦上：

每秒 10 Token 是什麼概念？你跟他面對面聊天或是做 Vibe Coding，等待回覆的時間會非常久，互動體驗會很差。

再看另一個例子：Google 開源的 gemma 4-31B（稠密）和 gemma 4-26B（混合專家 MoE）。有了前面的經驗你就知道，決定每秒輸出速度的關鍵不是看 B 數，而是架構（稠密 vs 混合專家）。

如果你不喜歡花時間反覆測試大模型，llmfit 可以幫你節省大量精神與體力。它能讓你快速從不同角度（分數、速度、參數量、記憶體、上下文、日期、應用場景）找到最適合你電腦的模型，不再盲目下載試錯。

希望這套工具也能幫助到正在為本地跑模型而困擾的你！