打工仔也想學 AI:Gen AI 開發的第一坑 Finetuning

更新 發佈閱讀 5 分鐘

我在我Substack上的電子報開設了一個新專題,分享自己由 0 開始學習 AI 開發的過程,例如 RAG、AI Agent,有興趣可以訂閱我的電子報。

2022-23 年,我還在香港當工程師。

那時候的我非常羨慕外國的工程師,偉大的防火牆讓我無法正常使用許多 AI 工具,AI 看起來就像是另一個世界的科技

後來我發現 GitHub Copilot 在香港不用 VPN 也能跑,馬上刷了 $100 USD 訂閱體驗一下。

還記得第一次看到在 VSCode 裏打幾個字後出現一堆 Placeholder,按個 Tab 就自動補好幾句程式碼,那種感覺真的爽到不行!

當時我拿 Copilot 給同事看,他們已經覺得我走在最前線了。

直到我搬來加拿大,能直接使用 OpenAI API,才真正開始接觸 AI 各種 AI 工具。

而我第一個念頭是:

做一個能根據公司內部文件回答問題的 Chatbot


為什麼會想做 Internal Chatbot?

原因很簡單:公司文件亂成一團。

除了初創公司之外,在我以前待的中大型公司遇到問題時,常常要先從一堆內部資料找頭緒,例如內聯網、Confluence、JIRA、Google Doc、FTP 伺服器…

就算找到了,大部份也沒有統一的文件格式。

有人是圖像派、有人是純文字派,而更多人是相信程式碼能自己說話,乾脆不寫文件。

曾經有團隊試圖統一格式,做了個模版讓大家跟著寫,但無奈舊文件實在太多沒人想動,新文件又總是有「更急的事」而草草了事。

幾年後團隊一換人,那套格式自然也就失傳了。

所以我想做一個擁有公司內部知識的 Chatbot,幫工程師回答常見問題,或者至少從垃圾場中翻出一兩個可能有用的連結,總比花個幾小時還只能找到個桔要好。


第一步就走錯了路

當時的我對 RAG、Embedding、Retrieval 這些完全沒有概念,只是一股腦地想玩 Gen AI,找點新技術來嘗鮮。

在 OpenAI 文件看到 Fine-tuning 的介紹,說得好像能教模型客製化的知識,一時熱血上頭,就這樣衝進去了。

第一次嘗試,我是用 Excel 手動建立資料集,裏面有 Prompt 和 Completion 兩欄。

我自己寫了大約 240 行問答配對,然後丟去 Fine-tune。

第一次 Fine-tune 用的資料,EOP 是我當時用的 Prompt Delimiter

第一次 Fine-tune 用的資料,EOP 是我當時用的 Prompt Delimiter

結果,模型答得一塌糊塗,還不時出現亂碼。

後來我改變策略,改為同一問題寫 5 種問法,讓資料量擴充到 1100 行後再來一次。

修改後的資料,EOC 是我當時用的 Completion Delimiter

修改後的資料,EOC 是我當時用的 Completion Delimiter

這次好一點,偶爾能答出我想要的內容,但大多時候還是答非所問,甚至會憑空捏造沒提供的資訊。

當時我也沒深究怎樣的資料才叫好,整理資料的方法只是自己摸出來的,歡迎各路大神指錯🙏🏻


盲目追新技術的教訓

多試幾次後,我意識到光靠自己是很難把模型 Finetune 得好的。

一來需要大量的資料,二來我缺乏相關知識。

最後我選擇暫停這個實驗,但這段經驗也讓我學到兩件事:

模型像小孩,而不是 API

它不像傳統 API 一樣能被準確控制,不是我寫一行就跑一行。

更像的是一個小孩,而工程師就像父母,要一直餵它資料,靠大量例子、適當的獎勵及懲罰去引導它學習。

這對習慣掌握流程的工程師來說是一種全新的開發體驗。

資料的質最為重要,但也不能忽視量

「Garbage In, Garbage Out」這句話,在 AI 開發裏是鐵則。

資料的品質不用多說,內容含糊不清或有誤導,模型學到的就是垃圾 (難怪需要 Data Engineer 這專業了😂)

同一時間資料太少也不行,它就像人一樣,一知半解最危險。考試前只看講義,不做練習題,通常都考不出好成績。

想了解更多關於 Fine-tuning 的資料可以參考此網頁


雖然這次只做到一個簡單的 POC 就停下來,但它讓我知道 Gen AI 開發也許沒有想像中那麼遙不可及 (雖然還是很難啦😂)。

也許正是這次經驗,種下了現在決心深入研究 Gen AI 的種子。

這是我電子報《打工仔也想學 AI》新系列的第一篇,下一篇將會寫:

  • 同樣的問題,為什麼我後來選擇 RAG 而非 Finetune
  • 怎樣在本地環境用低規格電腦跑 LLM

如果你對實作細節有興趣的話,歡迎閱讀我此篇電子報

留言
avatar-img
Keith的沙龍
0會員
17內容數
Keith的沙龍的其他內容
2025/07/08
我會在Substack上分享更多關於北美職場上的所見所聞,有興趣可以訂閱我的電子報。
2025/07/08
我會在Substack上分享更多關於北美職場上的所見所聞,有興趣可以訂閱我的電子報。
2025/05/26
最近看到Kelly分享一段影片,模擬以應徵者身份參與軟體工程師的技術面試,面試官是Amazon的工程師,理所當然地面試內容是Leetcode類型...
Thumbnail
2025/05/26
最近看到Kelly分享一段影片,模擬以應徵者身份參與軟體工程師的技術面試,面試官是Amazon的工程師,理所當然地面試內容是Leetcode類型...
Thumbnail
看更多
你可能也想看
Thumbnail
AI 相關的內容每天都非常多,有聽過很多人因此感覺到焦慮,怕錯過了最新資訊就會趕不上,這篇內容會跟大家詳細的分享我自己的學習方法和經驗,並且會在最後分享一些我的學習資訊來源。
Thumbnail
AI 相關的內容每天都非常多,有聽過很多人因此感覺到焦慮,怕錯過了最新資訊就會趕不上,這篇內容會跟大家詳細的分享我自己的學習方法和經驗,並且會在最後分享一些我的學習資訊來源。
Thumbnail
本文分析導演巴里・柯斯基(Barrie Kosky)如何運用極簡的舞臺配置,將布萊希特(Bertolt Brecht)的「疏離效果」轉化為視覺奇觀與黑色幽默,探討《三便士歌劇》在當代劇場中的新詮釋,並藉由舞臺、燈光、服裝、音樂等多方面,分析該作如何在保留批判核心的同時,觸及觀眾的觀看位置與人性幽微。
Thumbnail
本文分析導演巴里・柯斯基(Barrie Kosky)如何運用極簡的舞臺配置,將布萊希特(Bertolt Brecht)的「疏離效果」轉化為視覺奇觀與黑色幽默,探討《三便士歌劇》在當代劇場中的新詮釋,並藉由舞臺、燈光、服裝、音樂等多方面,分析該作如何在保留批判核心的同時,觸及觀眾的觀看位置與人性幽微。
Thumbnail
科技發達,AI智能也越來越發達。 蠢孩子,我每篇小說的圖片都是用AI製作的唷!!
Thumbnail
科技發達,AI智能也越來越發達。 蠢孩子,我每篇小說的圖片都是用AI製作的唷!!
Thumbnail
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 我們已經在 AI說書 - 從0開始 - 114 建立了 Transformer 模型,並在 AI說書 - 從0開始 - 115 載入權重並執行 Tokenizing,現
Thumbnail
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 我們已經在 AI說書 - 從0開始 - 114 建立了 Transformer 模型,並在 AI說書 - 從0開始 - 115 載入權重並執行 Tokenizing,現
Thumbnail
最新的AI趨勢讓人眼花撩亂,不知要如何開始學習?本文介紹了作者對AI的使用和體驗,以及各類AI工具以及推薦的選擇。最後強調了AI是一個很好用的工具,可以幫助人們節省時間並提高效率。鼓勵人們保持好奇心,不停止學習,並提出了對健康生活和開心生活的祝福。
Thumbnail
最新的AI趨勢讓人眼花撩亂,不知要如何開始學習?本文介紹了作者對AI的使用和體驗,以及各類AI工具以及推薦的選擇。最後強調了AI是一個很好用的工具,可以幫助人們節省時間並提高效率。鼓勵人們保持好奇心,不停止學習,並提出了對健康生活和開心生活的祝福。
Thumbnail
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 回顧 AI說書 - 從0開始 - 129 中說,Bidirectional Encoder Representations from Transformers (BER
Thumbnail
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 回顧 AI說書 - 從0開始 - 129 中說,Bidirectional Encoder Representations from Transformers (BER
Thumbnail
背景:從冷門配角到市場主線,算力與電力被重新定價   小P從2008進入股市,每一個時期的投資亮點都不同,記得2009蘋果手機剛上市,當時蘋果只要在媒體上提到哪一間供應鏈,隔天股價就有驚人的表現,當時光學鏡頭非常熱門,因為手機第一次搭上鏡頭可以拍照,也造就傳統相機廠的殞落,如今手機已經全面普及,題
Thumbnail
背景:從冷門配角到市場主線,算力與電力被重新定價   小P從2008進入股市,每一個時期的投資亮點都不同,記得2009蘋果手機剛上市,當時蘋果只要在媒體上提到哪一間供應鏈,隔天股價就有驚人的表現,當時光學鏡頭非常熱門,因為手機第一次搭上鏡頭可以拍照,也造就傳統相機廠的殞落,如今手機已經全面普及,題
Thumbnail
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 先做個總回顧: Transformer 架構總覽:AI說書 - 從0開始 - 39 Attention 意圖說明:AI說書 - 從0開始 - 40 Transfo
Thumbnail
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 先做個總回顧: Transformer 架構總覽:AI說書 - 從0開始 - 39 Attention 意圖說明:AI說書 - 從0開始 - 40 Transfo
Thumbnail
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 延續AI說書 - 從0開始 - 22解釋Foundation Model與Engines意涵後,我們來試用看看ChatGPT。 嘗試問以下問題:Provide a
Thumbnail
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 延續AI說書 - 從0開始 - 22解釋Foundation Model與Engines意涵後,我們來試用看看ChatGPT。 嘗試問以下問題:Provide a
Thumbnail
《轉轉生》(Re:INCARNATION)為奈及利亞編舞家庫德斯.奧尼奎庫與 Q 舞團創作的當代舞蹈作品,結合拉各斯街頭節奏、Afrobeat/Afrobeats、以及約魯巴宇宙觀的非線性時間,建構出關於輪迴的「誕生—死亡—重生」儀式結構。本文將從約魯巴哲學概念出發,解析其去殖民的身體政治。
Thumbnail
《轉轉生》(Re:INCARNATION)為奈及利亞編舞家庫德斯.奧尼奎庫與 Q 舞團創作的當代舞蹈作品,結合拉各斯街頭節奏、Afrobeat/Afrobeats、以及約魯巴宇宙觀的非線性時間,建構出關於輪迴的「誕生—死亡—重生」儀式結構。本文將從約魯巴哲學概念出發,解析其去殖民的身體政治。
Thumbnail
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 目前我們已經有資料集在 AI說書 - 從0開始 - 103 ,必要的清理函數在 AI說書 - 從0開始 - 104 ,現在把它們湊在一起,如下: # load Eng
Thumbnail
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 目前我們已經有資料集在 AI說書 - 從0開始 - 103 ,必要的清理函數在 AI說書 - 從0開始 - 104 ,現在把它們湊在一起,如下: # load Eng
Thumbnail
這是一場修復文化與重建精神的儀式,觀眾不需要完全看懂《遊林驚夢:巧遇Hagay》,但你能感受心與土地團聚的渴望,也不急著在此處釐清或定義什麼,但你的在場感受,就是一條線索,關於如何找著自己的路徑、自己的聲音。
Thumbnail
這是一場修復文化與重建精神的儀式,觀眾不需要完全看懂《遊林驚夢:巧遇Hagay》,但你能感受心與土地團聚的渴望,也不急著在此處釐清或定義什麼,但你的在場感受,就是一條線索,關於如何找著自己的路徑、自己的聲音。
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News