AI系列-1: RAG+LLM：下一代知識引擎的挑戰與突破

2025/03/03 更新2025/03/03 發佈閱讀 3 分鐘

近年來，AI 技術的飛速發展，讓「問答機器人」成為大眾關注的焦點。RAG（檢索增強生成）+ LLM（大型語言模型）技術，更被視為下一代知識引擎的基石，有望顛覆我們獲取資訊的方式。然而，RAG + LLM 真的是一個簡單的「即插即用」工具嗎？它是否能夠像我們期待的那樣，隨時隨地提供精準、全面的答案？

RAG + LLM 的核心概念，是結合 LLM 強大的語言生成能力，以及外部資料庫的知識檢索能力。透過這種方式，LLM 不再只是依賴訓練資料中的知識，而是能夠即時存取外部資訊，產生更精準、更全面的答案。

案例分析：

以醫療領域為例，RAG + LLM 有望協助醫生快速檢索最新的醫學研究、臨床指南和患者病歷，從而提供更精準的診斷和治療方案。

在金融領域，RAG + LLM 可以幫助分析師快速檢索市場數據、財務報告和新聞資訊，從而做出更明智的投資決策。

然而，理想很豐滿，現實卻很骨感。在實際應用中，我們發現 RAG + LLM 的複雜度，遠遠超出我們的想像。它不僅僅是將資料庫連接到 LLM，更涉及到以下幾個關鍵挑戰：

向量空間的建立與維護：

為了讓 LLM 能夠快速找到相關資訊，我們需要將外部資料庫轉換成向量空間。

這個過程需要大量的資料、專業的技術，以及持續的維護。

根據研究，一個高品質的向量空間，可以將 RAG 系統的檢索準確度提高 30% 以上。

在今天的嘗試中，我們使用了 SentenceTransformer 模型，將我們的 rag_she.json 資料集轉換成 768 維的向量空間。

檢索策略的設計：

如何設計有效的檢索策略，確保 LLM 能夠找到最相關的資訊，是一個複雜的問題。

不同的檢索策略，會對 RAG 系統的效能產生重大影響。

例如，使用混合檢索策略（結合關鍵字檢索和向量檢索），可以提高檢索的全面性和準確性。

我們嘗試了使用 FAISS 函式庫建立向量索引，並將其與 Facebook 的 RAG 模型結合使用。

LLM 的適應性：

LLM 需要能夠有效地利用檢索到的資訊，並將其整合到生成的答案中。

這涉及到複雜的自然語言處理和推理能力。

目前，LLM 在處理複雜推理和多輪對話方面，仍然存在一定的挑戰。

我們發現，即使我們提供了正確的檢索結果，LLM 也未必能夠生成流暢、自然的答案。

在我們的實作過程中，我們嘗試使用 Facebook 的 RAG 模型，連接我們自己的資料庫。然而，我們發現模型始終無法正確載入我們的資料，而是不斷嘗試載入預設的 wiki_dpr 資料集。這讓我們意識到，RAG + LLM 的複雜度，可能遠遠超出我們的預期。

熱門名詞：

向量嵌入（Vector Embedding）：

將文字、圖像等資料轉換成高維空間中的向量。

向量索引（Vector Index）：

用於快速搜索相似向量的資料結構。

例如，FAISS、Annoy 和 HNSW。

混合檢索（Hybrid Retrieval）：

結合關鍵字檢索和向量檢索的檢索策略。

例如，使用 BM25 進行關鍵字檢索，使用 FAISS 進行向量檢索。

留言

管仲的沙龍

9會員

26內容數

養貓,音樂,經絡與預防醫學,企業經營管理,大國博弈,區塊鏈

管仲的沙龍的其他內容

2025/03/07

AI系列5: AI代理時代來臨：Manus開啟2025年產業革命

本文探討2025年AI代理技術的突破性發展，尤其以Monica.im公司發布的Manus為例，分析其對產業及資本主義體系可能造成的深遠影響。文章回顧了自2022年以來AI產業的演進，並剖析關鍵玩家及技術趨勢

2025/03/07

AI系列5: AI代理時代來臨：Manus開啟2025年產業革命

2025/03/06

AI系列-4：AI時代開源軟體的法律真相：揭露「邊疆」掠奪與資訊產業的法律責任

本文探討美國政府與企業在資訊產業，尤其開源軟體領域的法律責任。分析「免費」背後的商業策略，及其對全球市場和消費者權益的影響，並以藥品、汽車等產業案例對比，強調資訊產業須承擔法律責任，建立健康、公平的數位生態系統。

2025/03/06

AI系列-4：AI時代開源軟體的法律真相：揭露「邊疆」掠奪與資訊產業的法律責任

2025/03/05

AI系列-3 RAG + LLM 技術解析：巨頭策略、開源方案與產業應用

本文探討 RAG + LLM 技術的應用與挑戰，分析 Google、IBM、微軟、AWS 等科技巨頭和開源社群的策略，並提供新進業者和企業在導入 RAG + LLM 系統時的建議，包括重視向量空間建立、選擇合適的 RAG 策略、持續學習和實驗以及資料品質等面向。

2025/03/05

AI系列-3 RAG + LLM 技術解析：巨頭策略、開源方案與產業應用

看更多

你可能也想看

Learn AI 不 BI

AI說書 - 從0開始 - 89

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。回顧 AI說書 - 從0開始 - 87 說：Wang 等人 2019 年的論文，提供了合理答案的選擇 (Choice of Plausible Answers, COP

#AI#ai#PromptEngineering

2024/07/14

Learn AI 不 BI

AI說書 - 從0開始 - 89

#AI#ai#PromptEngineering

2024/07/14

釀電影，啜一口電影的美好。

性別之外，存在面前──淺談劇作《遊林驚夢：巧遇 Hagay》

這是一場修復文化與重建精神的儀式，觀眾不需要完全看懂《遊林驚夢：巧遇Hagay》，但你能感受心與土地團聚的渴望，也不急著在此處釐清或定義什麼，但你的在場感受，就是一條線索，關於如何找著自己的路徑、自己的聲音。

#2026北藝嚴選#北藝嚴選#臺北表演藝術中心

2026/03/02

釀電影，啜一口電影的美好。

性別之外，存在面前──淺談劇作《遊林驚夢：巧遇 Hagay》

#2026北藝嚴選#北藝嚴選#臺北表演藝術中心

2026/03/02

管仲的沙龍

AI系列-1: RAG+LLM：下一代知識引擎的挑戰與突破

RAG(檢索增強生成)+LLM(大型語言模型)技術被視為下一代知識引擎的基石，但實際應用中複雜度遠超預期。本文探討RAG+LLM的關鍵挑戰，包含向量空間建立與維護、檢索策略設計及LLM的適應性。文中分析以醫療、金融領域為例，並提及向量嵌入、向量索引(如FAISS)、混合檢索等熱門名詞與技術。

#資訊#模型#Facebook

2025/03/03

管仲的沙龍

AI系列-1: RAG+LLM：下一代知識引擎的挑戰與突破

#資訊#模型#Facebook

2025/03/03

Everything ✨

AI 模型的進化｜從大型語言模型LLM 到多模態模型LMM

大型語言模型(LLM)是基於深度學習的自然語言處理模型，而多模態模型(LMM)能處理多種資料型態。這些模型將對未來帶來重大改變。LLM 專注於理解和生成自然語言，LMM 能夠處理跨模態的內容，並整合多種資料的能力，有望成為未來趨勢。

#ChatGPT#AI#人工智慧

2024/02/24

Everything ✨

AI 模型的進化｜從大型語言模型LLM 到多模態模型LMM

#ChatGPT#AI#人工智慧

2024/02/24

Learn AI 不 BI

AI說書 - 從0開始 - 90

#AI#ai#PromptEngineering

2024/07/15

Learn AI 不 BI

AI說書 - 從0開始 - 90

#AI#ai#PromptEngineering

2024/07/15

陳沅綦的沙龍

柏林劇團《三便士歌劇》：巴里．柯斯基的經典再造，與布萊希特劇場的當代轉向

本文分析導演巴里・柯斯基（Barrie Kosky）如何運用極簡的舞臺配置，將布萊希特（Bertolt Brecht）的「疏離效果」轉化為視覺奇觀與黑色幽默，探討《三便士歌劇》在當代劇場中的新詮釋，並藉由舞臺、燈光、服裝、音樂等多方面，分析該作如何在保留批判核心的同時，觸及觀眾的觀看位置與人性幽微。

#2026北藝嚴選#北藝嚴選#臺北表演藝術中心

2026/02/11