LoRA（Low-Rank Adaptation）

2025/08/18 更新2025/08/18 發佈閱讀 2 分鐘

LoRA（Low-Rank Adaptation）是一種高效的微調技術，設計用於快速適應大型預訓練模型（如GPT、BERT、T5）以完成特定任務，同時大幅減少需要調整的參數數量。它通過在模型的權重矩陣中引入低秩（low-rank）分解，僅學習少量可訓練參數，避免完整微調帶來的龐大計算和記憶體消耗。

LoRA的核心原理：

• 將模型中某個大權重矩陣的更新表示為兩個低秩矩陣和的乘積：。

• 保持原始預訓練模型權重凍結不變，只訓練這兩個低秩矩陣，完成調整。

• 這樣能減少需要訓練的參數數量，同時保有原模型知識，支持快速且資源節省的微調。

主要優點：

• 參數效率：僅調整極少數參數，節約記憶體和計算成本。

• 保留預訓練知識：模型主體權重不變，降低微調風險且易於回退到原模型。

• 易整合：可用於各種 Transformer 類大型模型，且不增加推理延遲。

• 訓練速度快：大大縮短微調時間，適合少量數據或快速迭代。

應用場景：

• 自然語言處理（NLP）中的領域適應或特定任務微調。

• 計算機視覺模型輕量級微調。

• 個性化模型定制以及多任務模型共享。

簡單比喻：

LoRA 就像是在原本龐大的機器內部加裝了一個小巧精緻的調節器，通過調整這個調節器達到改變整體功能的效果，而不需重新打造整個機器。

總結：

LoRA 是一種低秩矩陣分解的高效微調方法，通過少量參數調整完成大模型快速、節省成本的任務定制，已成為大型神經網絡微調的流行技術。

含 AI 應用內容

郝信華 iPAS AI應用規劃師學習筆記生成式AI技術與應用

留言

郝信華 iPAS AI應用規劃師學習筆記

46會員

572內容數

現職 : 富邦建設資訊副理證照：經濟部 iPAS AI應用規劃師初級+中級(數據分析) AWS AIF-C01 AWS CLF-C02 Microsoft AI-900 其他：富邦美術館志工

郝信華 iPAS AI應用規劃師學習筆記的其他內容

2025/08/18

Textual Inversion

Textual Inversion 是一種用於個性化文字到圖像生成模型（如 Stable Diffusion）的技術。它允許用戶通過少量示例圖片（通常3-5張），讓模型學會一個新的「詞彙」或「概念」，這個詞彙對應於用戶提供的特定對象、風格或人物。主要原理： • 傳統的文字到圖像模型使用預訓練

2025/08/18

Textual Inversion

2025/08/18

Emergent Abilities（突現能力）

Emergent Abilities（突現能力）指的是在大型人工智慧模型（特別是大型語言模型）中，隨著模型規模、資料量和計算能力的增加，模型突然顯現出未被明確設計或訓練的全新技能或行為。這些能力不是模型明確被編程或預訓練的，而是隨著系統的複雜度提升自發出現，帶有某種不可預測性。主要特點： •

2025/08/18

Emergent Abilities（突現能力）

2025/08/18

FID（Fréchet Inception Distance）

FID（Fréchet Inception Distance）是一種用來評估生成式模型（如GAN或擴散模型）所產生圖像品質的指標。其核心目標是比較生成圖像與真實圖像的分布差異，以量化生成圖像的真實性和多樣性。 FID 的工作原理 • 使用預訓練的 Inception-v3 網路提取生成圖像和真

2025/08/18

FID（Fréchet Inception Distance）

看更多

你可能也想看

Alan Tseng的沙龍

超簡單! 一文理解如何使用私有大型語言模型LLM - Ollama＋Open WebUI篇

本文會教你如何以最簡單方式使用Ollama＋Open WebUI

#ollama#llm#大型語言模型

2024/07/19

Alan Tseng的沙龍

超簡單! 一文理解如何使用私有大型語言模型LLM - Ollama＋Open WebUI篇

本文會教你如何以最簡單方式使用Ollama＋Open WebUI

#ollama#llm#大型語言模型

2024/07/19

Learn AI 不 BI

AI說書 - 從0開始 - 82

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。 Transformer 可以透過繼承預訓練模型 (Pretrained Model) 來微調 (Fine-Tune) 以執行下游任務。 Pretrained Mo

#AI#ai#PromptEngineering

2024/07/10

Learn AI 不 BI

AI說書 - 從0開始 - 82

#AI#ai#PromptEngineering

2024/07/10

Learn AI 不 BI

AI說書 - 從0開始 - 127 | BERT 和 Transformer 模型比較

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。回顧 AI說書 - 從0開始 - 39 至 AI說書 - 從0開始 - 69 的第二章內容，我們拿 Encoder 出來看：幾點注意如下： BERT 模型使用 M

#AI#ai#PromptEngineering

2024/08/11

Learn AI 不 BI

AI說書 - 從0開始 - 127 | BERT 和 Transformer 模型比較

#AI#ai#PromptEngineering

2024/08/11

Learn AI 不 BI

AI說書 - 從0開始 - 130 | Masked Language Modeling 訓練

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。回顧 AI說書 - 從0開始 - 129 中說，Bidirectional Encoder Representations from Transformers (BER

#AI#ai#PromptEngineering

2024/08/13

Learn AI 不 BI

AI說書 - 從0開始 - 130 | Masked Language Modeling 訓練

#AI#ai#PromptEngineering

2024/08/13

趙鐸的沙龍

《轉轉生 Re:INCARNATION》：釋放差異的身體裂縫

長期以來，西方美學以《維特魯威人》式的幾何比例定義「完美身體」，這種視覺標準無形中成為殖民擴張與種族分類的暴力工具。本文透過分析奈及利亞編舞家庫德斯．奧尼奎庫的舞作《轉轉生》，探討當代非洲舞蹈如何跳脫「標本式」的文化觀看。

#2026北藝嚴選#北藝嚴選#臺北表演藝術中心

2026/02/28

趙鐸的沙龍

《轉轉生 Re:INCARNATION》：釋放差異的身體裂縫

#2026北藝嚴選#北藝嚴選#臺北表演藝術中心

2026/02/28

Learn AI 不 BI

AI說書 - 從0開始 - 95

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。延續 AI說書 - 從0開始 - 93 介紹了 The Corpus of Linguistic Acceptability (CoLA)，其核心思想為：如果該句子在語

#AI#ai#PromptEngineering

2024/07/18

Learn AI 不 BI

AI說書 - 從0開始 - 95

#AI#ai#PromptEngineering

2024/07/18

Learn AI 不 BI

AI說書 - 從0開始 - 128 | Transformer 和 BERT 模型參數比較

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。在 AI說書 - 從0開始 - 127 中提及： Transformer 的關鍵參數為：原始 Transformer 模型中，左圖的 N = 6 原始 Tran

#AI#ai#PromptEngineering

2024/08/12

Learn AI 不 BI

AI說書 - 從0開始 - 128 | Transformer 和 BERT 模型參數比較

#AI#ai#PromptEngineering

2024/08/12

Amily的沙龍

在理解與拒絕之間：從多重身分觀看《海妲．蓋柏樂》

若說易卜生的《玩偶之家》為 19 世紀的女性，開啟了一扇離家的窄門，那麼《海妲．蓋柏樂》展現的便是門後的窒息世界。本篇文章由劇場演員 Amily 執筆，同為熟稔文本的演員，亦是深刻體察制度縫隙的當代女性，此文所看見的不僅僅是崩壞前夕的最後發聲，更是女人被迫置於冷酷的制度之下，步步陷入無以言說的困境。

#2026北藝嚴選#北藝嚴選#臺北表演藝術中心

2026/02/28