「RAG + 微調」混合架構 - AI 公司最常用的 dataset 技術

更新 發佈閱讀 7 分鐘

現在 AI 公司最常用的 dataset 技術

「RAG + 微調」混合架構

它能讓小模型能力 提升 5~20 倍

目前 AI 系統非常主流的一種架構:RAG + 微調(Fine-tuning)混合架構。很多公司都使用這種方法來打造專業 AI 助手,因為它能讓模型既有知識又能查最新資料。


一、什麼是 RAG

RAG(Retrieval-Augmented Generation) 檢索增強生成的概念是:

</>Plain text
使用者問題


搜尋知識庫(向量資料庫)


把找到的資料加入 Prompt


LLM 生成回答

簡單說:

模型不記住所有知識,而是需要時去查資料。


二、RAG 的基本架構

</>Plain text
文件 → 切分 → 向量化 → 向量資料庫


使用者問題 → 向量搜尋 → 找到相關內容


LLM + context → 回答

常見元件:

vocus|新世代的創作平台

常用向量資料庫:

  • FAISS
  • Milvus
  • Chroma

三、Python RAG 簡化範例

假設你有一堆文件:

</>Plain text
documents/
tang_history.txt
wuxia_skills.txt

先做 embedding:

</>Python
from sentence_transformers import SentenceTransformer
import faiss

model = SentenceTransformer("all-MiniLM-L6-v2")

docs = [
"安祿山是唐朝節度使",
"華山派以劍法聞名",
"寒元真訣是一種內功"
]

embeddings = model.encode(docs)

建立向量索引:

</>Python
index = faiss.IndexFlatL2(384)
index.add(embeddings)

查詢:

</>Python
query = model.encode(["安祿山是誰"])

D, I = index.search(query, k=2)

print([docs[i] for i in I[0]])

找到相關知識:

</>Plain text
安祿山是唐朝節度使

然後把它放進 Prompt:

</>Plain text
Context:
安祿山是唐朝節度使

Question:
安祿山是誰

LLM 就能回答。


四、RAG 的優點

vocus|新世代的創作平台

所以企業很愛用。


五、RAG 的缺點

vocus|新世代的創作平台

因此很多公司會:

RAG + 微調


六、RAG + Fine-tuning

混合架構:

</>Plain text
┌─────────────┐
LLM 模型 │
(微調過)
└──────┬──────┘

加入 RAG context


最終回答

微調負責:

  • 回答風格
  • 專業推理
  • tool calling

RAG 負責:

  • 提供知識
  • 更新資料

七、為何混合架構效果最好

原因很簡單:

LLM 記憶是有限的。

例如:

7B 模型

</>Plain text
參數 ≈ 7B

但公司資料:

</>Plain text
文件 ≈ 100GB

模型不可能全部記住。

所以:

</>Plain text
模型負責推理
RAG 負責記憶

八、企業實際應用

很多 AI 系統是這樣:

</>Plain text
使用者


API


RAG 搜尋


LLM(微調)


回答

例如 AI 客服:

  • 產品文件
  • FAQ
  • 公司規則

都存在 RAG。


九、4090 可以跑完整 RAG

一台 RTX4090 就可以:

vocus|新世代的創作平台

甚至可以在家做 私人 AI 知識庫


十、很少人知道的關鍵技巧

真正強的 RAG 不是「直接塞文件」。

而是:

Chunk + Metadata

例如:

</>Plain text
文件


切成 500 tokens


加 metadata

例子:

</>JSON
{
"text":"安祿山是唐朝節度使",
"source":"tang_history",
"year":755
}

這樣搜尋更準確。


十一、RAG 進階技術

目前最強的 RAG 系統會加:

1️⃣ Re-ranking

2️⃣ Multi-query search

3️⃣ Graph RAG

Graph RAG 很熱門。


十二、Graph RAG

不是只存文字,而是存 知識關係

例如:

</>Plain text
安祿山 → 發動 → 安史之亂
安祿山 → 對抗 → 唐玄宗

這種圖資料庫:

  • Neo4j(Graph Database Management System)

LLM 查詢後再回答。


總結

現在最主流 AI 架構:

</>Plain text
RAG + Fine-tuning + Tool calling

能力:

  • 查資料
  • 推理
  • 用工具

這就是現代 AI agent 的基礎。


留言
avatar-img
sirius數字沙龍
16會員
405內容數
吃自助火鍋啦!不要客氣,想吃啥,請自行取用!
sirius數字沙龍的其他內容
2026/03/06
一步一步示範 Self-Instruct(自動生成訓練資料)的方法。 這是很多模型(如 OpenAI、Stanford University 研究團隊)提出並實際使用的技巧,可以用一個強模型自動生成大量資料,然後用來微調另一個模型。
Thumbnail
2026/03/06
一步一步示範 Self-Instruct(自動生成訓練資料)的方法。 這是很多模型(如 OpenAI、Stanford University 研究團隊)提出並實際使用的技巧,可以用一個強模型自動生成大量資料,然後用來微調另一個模型。
Thumbnail
2026/03/06
這是很多人自己做「私人 AI 助手 / 領域模型」的典型做法。整體分成:模型選擇 → 資料 → 訓練 → 推論部署。 一、硬體條件(RTX 4090) RTX 4090 VRAM:24GB FP16 算力:約 82 TFLOPS 適合:LoRA / QLoRA 微調 能訓練模型大小:
Thumbnail
2026/03/06
這是很多人自己做「私人 AI 助手 / 領域模型」的典型做法。整體分成:模型選擇 → 資料 → 訓練 → 推論部署。 一、硬體條件(RTX 4090) RTX 4090 VRAM:24GB FP16 算力:約 82 TFLOPS 適合:LoRA / QLoRA 微調 能訓練模型大小:
Thumbnail
2026/03/06
示範一個 RTX 4090 用於訓練 LLM「工具調用(Tool Calling)」的資料格式。這種格式比原本的 Python 範例更接近 OpenAI / Llama / DeepSeek / function calling dataset 常見結構。
Thumbnail
2026/03/06
示範一個 RTX 4090 用於訓練 LLM「工具調用(Tool Calling)」的資料格式。這種格式比原本的 Python 範例更接近 OpenAI / Llama / DeepSeek / function calling dataset 常見結構。
Thumbnail
看更多
你可能也想看
Thumbnail
因應疫情下的外帶需求,部落格平台痞客邦推出「外帶搜尋小幫手」,協助民眾快速查詢所在地附近,有哪些餐廳店家提供外帶服務以方便採買。此外,痞客邦日前也推出「居家防疫專區」,集結實用資訊與防疫宣導,希望協助陪伴民眾度過居家防疫新生活
Thumbnail
因應疫情下的外帶需求,部落格平台痞客邦推出「外帶搜尋小幫手」,協助民眾快速查詢所在地附近,有哪些餐廳店家提供外帶服務以方便採買。此外,痞客邦日前也推出「居家防疫專區」,集結實用資訊與防疫宣導,希望協助陪伴民眾度過居家防疫新生活
Thumbnail
這是一場修復文化與重建精神的儀式,觀眾不需要完全看懂《遊林驚夢:巧遇Hagay》,但你能感受心與土地團聚的渴望,也不急著在此處釐清或定義什麼,但你的在場感受,就是一條線索,關於如何找著自己的路徑、自己的聲音。
Thumbnail
這是一場修復文化與重建精神的儀式,觀眾不需要完全看懂《遊林驚夢:巧遇Hagay》,但你能感受心與土地團聚的渴望,也不急著在此處釐清或定義什麼,但你的在場感受,就是一條線索,關於如何找著自己的路徑、自己的聲音。
Thumbnail
現在,台灣大哥大攜手 Perplexity AI,為所有台灣大哥大用戶帶來一個令人興奮的機會:免費享有 Perplexity Pro 一年!(價值8,280元)這不僅是一項優惠,更是一個讓台灣用戶搶先體驗 AI 驅動搜尋新紀元的絕佳機會。 跨時代革命性 AI 搜尋引擎,整合大型語言模型 (LL
Thumbnail
現在,台灣大哥大攜手 Perplexity AI,為所有台灣大哥大用戶帶來一個令人興奮的機會:免費享有 Perplexity Pro 一年!(價值8,280元)這不僅是一項優惠,更是一個讓台灣用戶搶先體驗 AI 驅動搜尋新紀元的絕佳機會。 跨時代革命性 AI 搜尋引擎,整合大型語言模型 (LL
Thumbnail
這篇文章訴說了盧小小應對丈夫外遇的過程,從宣示主權到求助神明再到訴諸法律,最終找到專業徵信社協助,經過一系列波折打贏了官司,證據及戰略應對是關鍵。這篇相當精彩。
Thumbnail
這篇文章訴說了盧小小應對丈夫外遇的過程,從宣示主權到求助神明再到訴諸法律,最終找到專業徵信社協助,經過一系列波折打贏了官司,證據及戰略應對是關鍵。這篇相當精彩。
Thumbnail
AI 寫文案!行銷技能:SEO、分析、提案-邱允文 在現今數位行銷的世界中,AI 可以幫助行銷人員提高工作效率,改善內容並提升業務成果。特別是在以下三個方面:SEO、資料分析、提案設計。這些都是行銷人的必備技能,使用 AI 可以大大提升效果與精度。 1. SEO(搜尋引擎改善) SEO 是指
Thumbnail
AI 寫文案!行銷技能:SEO、分析、提案-邱允文 在現今數位行銷的世界中,AI 可以幫助行銷人員提高工作效率,改善內容並提升業務成果。特別是在以下三個方面:SEO、資料分析、提案設計。這些都是行銷人的必備技能,使用 AI 可以大大提升效果與精度。 1. SEO(搜尋引擎改善) SEO 是指
Thumbnail
本文探討長期穩定的內容輸出,如何將個人專業轉化為可被搜尋、收藏、重讀的內容資產,進而建立個人品牌,吸引長期關注與合作機會,並強調其超越短期曝光的價值。
Thumbnail
本文探討長期穩定的內容輸出,如何將個人專業轉化為可被搜尋、收藏、重讀的內容資產,進而建立個人品牌,吸引長期關注與合作機會,並強調其超越短期曝光的價值。
Thumbnail
立達徵信社擁有專業偵探團隊及多年實地調查經驗,無論手中線索多寡,我們都能透過地毯式搜索,協助客戶精準找到墳墓或祖墳的位置。若想諮詢費用或有委託需求,敬請致電立達徵信0800-250-555,專人隨時為您服務。找墳墓、建立族譜/家庭樹、親人協尋服務,立達私家偵探您的第一首選。
Thumbnail
立達徵信社擁有專業偵探團隊及多年實地調查經驗,無論手中線索多寡,我們都能透過地毯式搜索,協助客戶精準找到墳墓或祖墳的位置。若想諮詢費用或有委託需求,敬請致電立達徵信0800-250-555,專人隨時為您服務。找墳墓、建立族譜/家庭樹、親人協尋服務,立達私家偵探您的第一首選。
Thumbnail
Consensus 是一款專為學術研究設計的 AI 搜尋引擎,提供準確且具公信力的學術資料,可幫助研究者和學生快速找到引用次數最多的研究資料,並評估資料的價值和可靠性。這篇文章介紹了 Consensus 的功能、如何使用以及其優勢與特點,並分享了使用心得和應用場景。
Thumbnail
Consensus 是一款專為學術研究設計的 AI 搜尋引擎,提供準確且具公信力的學術資料,可幫助研究者和學生快速找到引用次數最多的研究資料,並評估資料的價值和可靠性。這篇文章介紹了 Consensus 的功能、如何使用以及其優勢與特點,並分享了使用心得和應用場景。
Thumbnail
近期有感房市下修,且房貸利率不段攀升下,對於目前正背負房貸及未來想要購屋的族群而言,壓力添增不少,然而,法拍市場正搶手, 透過法院拍賣,以較為優勢的價格取得房子,大大減輕購屋族的經濟壓力,但法拍屋應該自己投標或委託專業的法拍代標公司呢?本篇將帶您瞭解法拍代標公司提供哪些服務。
Thumbnail
近期有感房市下修,且房貸利率不段攀升下,對於目前正背負房貸及未來想要購屋的族群而言,壓力添增不少,然而,法拍市場正搶手, 透過法院拍賣,以較為優勢的價格取得房子,大大減輕購屋族的經濟壓力,但法拍屋應該自己投標或委託專業的法拍代標公司呢?本篇將帶您瞭解法拍代標公司提供哪些服務。
Thumbnail
《轉轉生》(Re:INCARNATION)為奈及利亞編舞家庫德斯.奧尼奎庫與 Q 舞團創作的當代舞蹈作品,結合拉各斯街頭節奏、Afrobeat/Afrobeats、以及約魯巴宇宙觀的非線性時間,建構出關於輪迴的「誕生—死亡—重生」儀式結構。本文將從約魯巴哲學概念出發,解析其去殖民的身體政治。
Thumbnail
《轉轉生》(Re:INCARNATION)為奈及利亞編舞家庫德斯.奧尼奎庫與 Q 舞團創作的當代舞蹈作品,結合拉各斯街頭節奏、Afrobeat/Afrobeats、以及約魯巴宇宙觀的非線性時間,建構出關於輪迴的「誕生—死亡—重生」儀式結構。本文將從約魯巴哲學概念出發,解析其去殖民的身體政治。
Thumbnail
背景:從冷門配角到市場主線,算力與電力被重新定價   小P從2008進入股市,每一個時期的投資亮點都不同,記得2009蘋果手機剛上市,當時蘋果只要在媒體上提到哪一間供應鏈,隔天股價就有驚人的表現,當時光學鏡頭非常熱門,因為手機第一次搭上鏡頭可以拍照,也造就傳統相機廠的殞落,如今手機已經全面普及,題
Thumbnail
背景:從冷門配角到市場主線,算力與電力被重新定價   小P從2008進入股市,每一個時期的投資亮點都不同,記得2009蘋果手機剛上市,當時蘋果只要在媒體上提到哪一間供應鏈,隔天股價就有驚人的表現,當時光學鏡頭非常熱門,因為手機第一次搭上鏡頭可以拍照,也造就傳統相機廠的殞落,如今手機已經全面普及,題
Thumbnail
本文分析導演巴里・柯斯基(Barrie Kosky)如何運用極簡的舞臺配置,將布萊希特(Bertolt Brecht)的「疏離效果」轉化為視覺奇觀與黑色幽默,探討《三便士歌劇》在當代劇場中的新詮釋,並藉由舞臺、燈光、服裝、音樂等多方面,分析該作如何在保留批判核心的同時,觸及觀眾的觀看位置與人性幽微。
Thumbnail
本文分析導演巴里・柯斯基(Barrie Kosky)如何運用極簡的舞臺配置,將布萊希特(Bertolt Brecht)的「疏離效果」轉化為視覺奇觀與黑色幽默,探討《三便士歌劇》在當代劇場中的新詮釋,並藉由舞臺、燈光、服裝、音樂等多方面,分析該作如何在保留批判核心的同時,觸及觀眾的觀看位置與人性幽微。
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News