
不知道大家有沒有這種經驗:看到一個很厲害的開源模型釋出,滿懷期待地下載到自己的電腦,結果跑起來卡到懷疑人生?或是花了大半天下載,最後發現根本跑不動,只能默默刪掉?
在本地端跑大型語言模型,最大的痛點就是:你永遠不曉得某個開源模型在自己的電腦上到底跑不跑得動、跑起來順不順、每秒能輸出多少 Token。市面上雖然有不少像「Can I run LLM」、「Can I use LLM」這類的網站服務,號稱只要打開網頁就能幫你查詢手機或電腦能否跑某個模型。但老實說,我自己用下來的感覺是——那些數字就只是擺在那邊好看,網頁上的資料跟實際跑出來的結果落差非常大,坦白講完全沒辦法當作參考依據。
於是 llmfit 出現了
今天要跟大家介紹的是 llmfit(GitHub 連結)。這是一套免費、開源的終端機介面工具(TUI),支援 Windows、macOS 和 Linux 三大主流作業系統。你可以透過終端機指令或安裝包來安裝,安裝完成後一開啟,馬上就能知道超過 500 種開源模型在你電腦上的跑分表現。
我自己實測的心得是:llmfit 顯示的數據跟真實跑分相當接近,完全可以作為參考依據。
不必再浪費時間下載試錯
有了 llmfit,你不需要再花幾十分鐘甚至好幾個小時(看網路速度和模型大小)去下載一個大模型,結果好不容易跑起來卻超級卡,可能勉強能動但根本無法實際使用,最後用不到幾秒就刪掉——這種過程真的會讓人懷疑人生。
尤其現在模型釋出就像車輪戰,一個接一個一直來。如果你跟我一樣喜歡玩各種大模型、愛測試新東西,應該很能體會這種痛。
自動偵測電腦規格,免手動設定
llmfit 安裝成功開啟後,它會自動偵測你當下電腦的硬體規格,完全不用手動輸入一堆參數。
預設的排序模式是 Date,也就是依照模型釋出發表的時間,從最新到最舊依序排列。比方說我錄製這篇文章的時候,DeepSeek V4 Flash 也才剛開源而已。
操作方面,你可以用鍵盤的上下鍵來切換選項,也可以用 Page Up 和 Page Down 切換分頁(因為是 TUI 終端機介面,無法用滑鼠滾輪)。另外,按 Home 鍵可以快速跳到當前排序的最後一筆(最舊的模型),按 End 鍵則可以跳到最新的一筆。
豐富的檢視與排序功能
- 按 Enter 鍵可以進入某個模型的詳細資訊頁面,按 Esc 返回上一頁。
- 按小寫 s 鍵可以切換不同的排序視角,包括:
score:跑分成績(最高分排最前)tps:每秒輸出 Token 數params:參數量mem:記憶體需求ctx:上下文長度date:釋出日期use_case:適用場景
例如切換到 score,你可以快速看到考試成績最高的模型排名;切換到 tok/s,則會按照輸出速度排序。但要注意,Token 最快的模型,成績可能只有 60 幾分——就像考試寫很快但錯誤一堆,快沒有用。所以大家要依照自己的需求切換不同視角,選擇最適合自己的模型。
快速搜尋功能
按斜線鍵 / 可以快速搜尋模型名稱。比如我搜尋「Qwen 3.6」,然後按 Esc 離開輸入框,再用 s 切回 Date 排序。
這裡顯示的數字,我自己親身體驗下來,真的滿準的,不是隨便寫一堆乍看好像有那麼一回事、但跟實際差很多的數字。至少我自己親自跑分測試了好幾輪、多個模型比對下來,確實是這樣。
一個真實案例:B 數不等於速度
我特別想提一個例子。請看:
- Qwen3.6-35B vs Qwen3.6-27B
如果你不知道這兩個模型的背景,看到 27B 和 35B,可能會直覺認為 27B 參數比較小、應該跑得比較快,35B 比較慢。但事實並非如此!
- Qwen3.6-35B 的核心架構是 混合專家(MoE)。雖然它有 350 億參數,但每次推理只使用其中 30 億參數來運行。
- Qwen3.6-27B 的核心架構是 稠密(Dense)。它有 270 億參數,但每次推理會動用全部 270 億參數。
結果在同一台電腦上:
- Qwen3.6-35B 每秒輸出可達 76 Token —— 這已經是完全可以用的等級。
- Qwen3.6-27B 每秒輸出只有 10 Token —— 能不能跑?可以,但非常慢。
每秒 10 Token 是什麼概念?你跟他面對面聊天或是做 Vibe Coding,等待回覆的時間會非常久,互動體驗會很差。
再看另一個例子:Google 開源的 gemma 4-31B(稠密)和 gemma 4-26B(混合專家 MoE)。有了前面的經驗你就知道,決定每秒輸出速度的關鍵不是看 B 數,而是架構(稠密 vs 混合專家)。
結語
如果你不喜歡花時間反覆測試大模型,llmfit 可以幫你節省大量精神與體力。它能讓你快速從不同角度(分數、速度、參數量、記憶體、上下文、日期、應用場景)找到最適合你電腦的模型,不再盲目下載試錯。
希望這套工具也能幫助到正在為本地跑模型而困擾的你!


