
RAG(Retrieval Augmented Generation),中文叫做「檢索增強生成」,一個聽起來很專業技術的技術名詞,但概念容易明白:在回答之前,先查尋相關資訊或知識,再據實回答。
RAG(檢索增強生成)是這樣運作的:
- 接收到訊息(需求或問題等)
- 在記憶(資料庫)中搜尋相關的資訊或知識
- 將搜集的資訊或知識放進上下文中
- 根據所搜集的資訊或知識回答
如此一來,AI的回答有憑有據,而不是憑藉可能過時或不準確的資訊或知識、或者模糊印象、甚至是假消息和不實訊息。
LLM(大型語言模型)擅長理解和推理,但其已知的資訊和知識是在訓練養成時就固著了。資料庫的資訊和知識可隨時儲存、更新,傳統的搜尋方式卻不夠聰明。
有了RAG(檢索增強生成),AI能運用聰明的方式搜尋、篩選資訊或知識,及運用強大的理解與邏輯能力統整回答。
傳統的關鍵字搜尋,只是搜尋使用者提供的關鍵字,將有關鍵字的所有資訊和知識羅列出來。
RAG的作法則是運用語意搜尋:
- 理解訊息--分析使用者的需求或問題等
- 拆解訊息--了解所要滿足的需求或解決的問題應或需用什麼方法、工具或條件等
- 語意搜尋--到有關的系統或資料庫等搜尋相關資訊或知識
- 統整回答--篩選並統整相關資訊或知識,言之有所根據
舉個實例,應用場景:
週末,你想觀看一場有主題活動的中華職棒球賽,享受現場熱情的應援氛圍和精彩的球賽體驗。你用AI Agent詢問棒球賽的相關資訊。你向AI問:「週末,我想看中華職棒的棒球比賽,請告訴我近期週末舉辦主題日的職棒賽事以及最低與最高票價是多少?」
傳統的關鍵字搜尋只會搜尋近期週末主題日中華職棒球賽的資訊,羅列出所有相關的資訊回覆你,你再從中查看最低和最高票價及其他有興趣的資訊。
RAG不只會搜尋相關資訊,還能更深入地查找篩選符合你的需求或問題的資訊,更細緻地回答你想知道的細節,它會直接告訴你最低票價是多少、最高票價是多少。




















