打工仔也想學 AI:在本地跑出第一個 LLM

更新 發佈閱讀 5 分鐘

我在我Substack上的電子報開設了一個新專題,分享自己由 0 開始學習 AI 開發的過程,例如 RAG、AI Agent,有興趣可以訂閱我的電子報。

還記得我上回提到的那個「喝醉酒的 Chatbot」嗎?

事情是這樣的:

我想做一個公司內部 Chatbot,試試看 AI 技術,於是沒想太多就動手準備了一些資料餵給模型去做 Fine-tuning。

結果誕生了一個前言不對後語、會講亂碼的模型…

我曾把這段經歷分享到某個討論區,有人問我:

為什麼不用 RAG?

嗯…

其實那時候的我不知道 RAG 是什麼。


Finetune V.S. RAG

為了不再讓我的模型宿醉,我開始研究 RAG,也重新思考 Fine-tuning 應該用在哪裏。

後來我大致畫下了這條分界線:

  • Finetune 較適合處理調整語氣、補上專業領域知識 (例如醫療、法律)
  • RAG (Retrieval Augmented Generation) 較適合根據最新資料回答問題,資料更新只需換 Embeddings (之後會深入探討此概念,暫時可理解為代表文字意思的數字),無須再次訓練模型

用日常例子來說的話:

Finetune 像大學選科,要花大把的金錢及時間,但畢業後就變成一個腦中有知識的人。

RAG 像開卷考試 (Open Book Exam),不用全都懂,只要買本書,找到資料就能作答。資料更新了,換書就好。

而我想做的 Chatbot 剛好有幾個特點:

  1. 資料更新頻密
  2. 團隊缺乏 AI / ML 人才
  3. 資料內容不算太專業

所以,RAG 才是更適合的選擇。

以下是一些關於 RAG 和 Finetuning 的補充資料:


想做 RAG,第一步得有自己的模型

作為一位新手,我一開始只知道 ChatGPT。

但不想付費用 OpenAI 的 API,又不想把公司資料上傳雲端的話,那怎麼辦呢?

調查一圈後,發現可以考慮的有幾個:

  • Hugging Face
  • LM Studio
  • Ollama

最後我選了 Ollama,因為:

  1. 支援 CLI 操作 (工程師的最愛)
  2. 公司資料留在本地,不怕外洩
  3. 教學資源豐富,容易上手

Ollama 是什麼?

一句話:

一個能在本地跑 LLM 的工具

可以用它來下載、部署、跑模型,熟 CLI 的話會覺得很順手。

它支援不少開源 (Open Source) 模型,例如:

  • deepseek (因低成本爆紅)
  • gemma (Google)
  • llama (Meta)
  • phi (Microsoft)

當中不乏參數少、佔硬碟少的模式,適合本地開發測試,可以到它的模型列表查看。


模型的名字怎麼來?

第一眼看到的時候覺得跟 Docker 映像的命名方法很相似,簡單來說是:

<品牌/系列><版本>:<參數量>
<Brand/Series><Version>:<Number of Parameters>

例如:

  • gemma3:4b (Google Gemma 系列的第 3 版本,40 億參數量)
  • llama3.1:8b (Meta Llama 系列的第 3.1 版本,80 億參數量)
  • phi3:3.8b (Microsfot Phi 系列的第 3 版本,38 億參數量)

參數越多,表現通常越好,但也更吃資源。選模型前,記得看清楚自己的電腦扛不扛得住。


LLM 不是萬能的,也不是穩定的

跑了幾輪 LLM 後,有些心得想要記錄下來:

沒有全能的模型

剛開始試了幾個模型,發現每個都有些不支援的功能:

  • Gemma 不支援 embeddings
  • DeepSeek 不支援 tool use

而且 Ollama 官網上寫的功能,有時也不太準…

所以我現在都當在「招新人」,一個個試用,不行就換。

同一個 Prompt 同一個模型,答案不一定一致

LLM 是根據機率運作的,就算同一個 Prompt 問 10 次,答案也可能有點不同。

這對習慣確定性的工程師來說,是種心理挑戰,因為不是寫個固定 input 就能得到固定的 output。

不是所有任務都適合 LLM

LLM 的能力大家有目共睹,我亦相信未來 LLM 能替我們做很多不同的工作,但如果我想要的答案是固定、不容模糊的答案的話 (例如報稅、計算邏輯),有時候寫死規則比用模型更快、更穩。

如果你對實作細節有興趣的話,歡迎閱讀我此篇電子報

留言
avatar-img
Keith的沙龍
0會員
17內容數
Keith的沙龍的其他內容
2025/08/02
我在我Substack上的電子報開設了一個新專題,分享自己由 0 開始學習 AI 開發的過程,例如 RAG、AI Agent,有興趣可以訂閱我的電子報。
Thumbnail
2025/08/02
我在我Substack上的電子報開設了一個新專題,分享自己由 0 開始學習 AI 開發的過程,例如 RAG、AI Agent,有興趣可以訂閱我的電子報。
Thumbnail
2025/07/08
我會在Substack上分享更多關於北美職場上的所見所聞,有興趣可以訂閱我的電子報。
2025/07/08
我會在Substack上分享更多關於北美職場上的所見所聞,有興趣可以訂閱我的電子報。
看更多
你可能也想看
Thumbnail
這是一場修復文化與重建精神的儀式,觀眾不需要完全看懂《遊林驚夢:巧遇Hagay》,但你能感受心與土地團聚的渴望,也不急著在此處釐清或定義什麼,但你的在場感受,就是一條線索,關於如何找著自己的路徑、自己的聲音。
Thumbnail
這是一場修復文化與重建精神的儀式,觀眾不需要完全看懂《遊林驚夢:巧遇Hagay》,但你能感受心與土地團聚的渴望,也不急著在此處釐清或定義什麼,但你的在場感受,就是一條線索,關於如何找著自己的路徑、自己的聲音。
Thumbnail
本文分析導演巴里・柯斯基(Barrie Kosky)如何運用極簡的舞臺配置,將布萊希特(Bertolt Brecht)的「疏離效果」轉化為視覺奇觀與黑色幽默,探討《三便士歌劇》在當代劇場中的新詮釋,並藉由舞臺、燈光、服裝、音樂等多方面,分析該作如何在保留批判核心的同時,觸及觀眾的觀看位置與人性幽微。
Thumbnail
本文分析導演巴里・柯斯基(Barrie Kosky)如何運用極簡的舞臺配置,將布萊希特(Bertolt Brecht)的「疏離效果」轉化為視覺奇觀與黑色幽默,探討《三便士歌劇》在當代劇場中的新詮釋,並藉由舞臺、燈光、服裝、音樂等多方面,分析該作如何在保留批判核心的同時,觸及觀眾的觀看位置與人性幽微。
Thumbnail
你對 AI 的認識有多少?你在生活或工作上有運用哪些 AI 的應用服務嗎?一起來了解這個目前很夯的議題。 根據 google 對 AI(artificial intelligence,縮寫為AI)的解釋:AI 是人工智慧,定義是打造電腦與機器的科學領域,可以進行推論、學習以及採取行動。這些過往需要
Thumbnail
你對 AI 的認識有多少?你在生活或工作上有運用哪些 AI 的應用服務嗎?一起來了解這個目前很夯的議題。 根據 google 對 AI(artificial intelligence,縮寫為AI)的解釋:AI 是人工智慧,定義是打造電腦與機器的科學領域,可以進行推論、學習以及採取行動。這些過往需要
Thumbnail
老實說,原本的我一直認為,AI是離我很遠的東西,即使是去年的 ChatGPT 熱潮,我也只是跟著偶爾在工作中跟AI聊天激發靈感而已。不過,就在前一陣子看了《AI 世界的底層邏輯與生存法則》這本書後,我才逐漸加深使用AI的頻率,並且把「讓AI成為工作中的標配」當作讓自己能習慣的方向。
Thumbnail
老實說,原本的我一直認為,AI是離我很遠的東西,即使是去年的 ChatGPT 熱潮,我也只是跟著偶爾在工作中跟AI聊天激發靈感而已。不過,就在前一陣子看了《AI 世界的底層邏輯與生存法則》這本書後,我才逐漸加深使用AI的頻率,並且把「讓AI成為工作中的標配」當作讓自己能習慣的方向。
Thumbnail
產品經理想做 AI 產品要懂哪些基本名詞?這篇整理我過往參與 AI 自傳生成時,和 NLP 工程師有討論到的概念,AI 應用目前還尚未普及,未來我會再陸續整理不同功能或產業需要知道的 AI 基礎知識。
Thumbnail
產品經理想做 AI 產品要懂哪些基本名詞?這篇整理我過往參與 AI 自傳生成時,和 NLP 工程師有討論到的概念,AI 應用目前還尚未普及,未來我會再陸續整理不同功能或產業需要知道的 AI 基礎知識。
Thumbnail
AI 履歷、AI 自傳、AI 找工作是近期很熱門的應用,但 AI 自傳要如何實現?身為產品經理要如何設計這個功能?如何套用到履歷編輯器內?這篇想分享我過往的產品發想經歷。
Thumbnail
AI 履歷、AI 自傳、AI 找工作是近期很熱門的應用,但 AI 自傳要如何實現?身為產品經理要如何設計這個功能?如何套用到履歷編輯器內?這篇想分享我過往的產品發想經歷。
Thumbnail
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 回顧 AI說書 - 從0開始 - 76 ,我們在給定句子 「 Transformers possess surprising emerging features 」的情
Thumbnail
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 回顧 AI說書 - 從0開始 - 76 ,我們在給定句子 「 Transformers possess surprising emerging features 」的情
Thumbnail
科技發達,AI智能也越來越發達。 蠢孩子,我每篇小說的圖片都是用AI製作的唷!!
Thumbnail
科技發達,AI智能也越來越發達。 蠢孩子,我每篇小說的圖片都是用AI製作的唷!!
Thumbnail
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 回顧 AI說書 - 從0開始 - 77 ,我們在給定句子 「 Transformers possess surprising emerging features 」的情
Thumbnail
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 回顧 AI說書 - 從0開始 - 77 ,我們在給定句子 「 Transformers possess surprising emerging features 」的情
Thumbnail
5 月將於臺北表演藝術中心映演的「2026 北藝嚴選」《海妲・蓋柏樂》,由臺灣劇團「晃晃跨幅町」製作,本文將以從舞台符號、聲音與表演調度切入,討論海妲・蓋柏樂在父權社會結構下的困境,並結合榮格心理學與馮.法蘭茲對「阿尼姆斯」與「永恆少年」原型的分析,理解女人何以走向精神性的操控、毀滅與死亡。
Thumbnail
5 月將於臺北表演藝術中心映演的「2026 北藝嚴選」《海妲・蓋柏樂》,由臺灣劇團「晃晃跨幅町」製作,本文將以從舞台符號、聲音與表演調度切入,討論海妲・蓋柏樂在父權社會結構下的困境,並結合榮格心理學與馮.法蘭茲對「阿尼姆斯」與「永恆少年」原型的分析,理解女人何以走向精神性的操控、毀滅與死亡。
Thumbnail
背景:從冷門配角到市場主線,算力與電力被重新定價   小P從2008進入股市,每一個時期的投資亮點都不同,記得2009蘋果手機剛上市,當時蘋果只要在媒體上提到哪一間供應鏈,隔天股價就有驚人的表現,當時光學鏡頭非常熱門,因為手機第一次搭上鏡頭可以拍照,也造就傳統相機廠的殞落,如今手機已經全面普及,題
Thumbnail
背景:從冷門配角到市場主線,算力與電力被重新定價   小P從2008進入股市,每一個時期的投資亮點都不同,記得2009蘋果手機剛上市,當時蘋果只要在媒體上提到哪一間供應鏈,隔天股價就有驚人的表現,當時光學鏡頭非常熱門,因為手機第一次搭上鏡頭可以拍照,也造就傳統相機廠的殞落,如今手機已經全面普及,題
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News