FID（Fréchet Inception Distance）

iPAS AI應用規劃師學習筆記

發佈於生成式AI技術與應用

2025/08/18 更新2025/08/18 發佈閱讀 2 分鐘

FID（Fréchet Inception Distance）是一種用來評估生成式模型（如GAN或擴散模型）所產生圖像品質的指標。其核心目標是比較生成圖像與真實圖像的分布差異，以量化生成圖像的真實性和多樣性。

FID 的工作原理

• 使用預訓練的 Inception-v3 網路提取生成圖像和真實圖像的高維特徵向量（通常取最後池化層的2048維特徵）。

• 假設這兩組特徵符合多維高斯分布，計算兩個高斯分布的均值和協方差矩陣。

• 利用 Fréchet 距離（或稱 Wasserstein-2 距離）衡量這兩個分布間的差距。

• FID 值越小代表生成圖像的質量和多樣性越接近真實圖像，分數為 0 表示完美匹配。

FID的優點與應用

• 比較整體分布而不是單張圖片，能有效捕捉圖像質量和樣本多樣性。

• 是目前生成式模型（如 StyleGAN、Stable Diffusion）評估的標準指標之一。

• 能對模糊、噪聲等圖像質量下降敏感。

限制和改進

• FID 假設特徵服從高斯分布，可能影響精準度。

• 需要大量圖像樣本才能穩定估計。

• 研究者提出使用CLIP特徵或其他指標來改進評估準確性。

總結：

FID 是一種基於深度特徵分布差異衡量生成圖像質量的指標，數值越小代表生成結果越真實和多樣化，是現今圖像生成模型效果最重要的量化評估工具。

含 AI 應用內容

郝信華 iPAS AI應用規劃師學習筆記生成式AI技術與應用

留言

郝信華 iPAS AI應用規劃師學習筆記

46會員

572內容數

現職 : 富邦建設資訊副理證照：經濟部 iPAS AI應用規劃師初級+中級(數據分析) AWS AIF-C01 AWS CLF-C02 Microsoft AI-900 其他：富邦美術館志工

郝信華 iPAS AI應用規劃師學習筆記的其他內容

2025/08/18

Positional Encoding

Positional Encoding 是深度學習中 Transformer 模型用來表示序列中各個元素（例如詞語）位置的技術。由於 Transformer 自身的自注意力機制（self-attention）在處理序列時會把輸入視為一個集合，缺乏對元素順序的內建感知，因此需要注入位置信息讓模型能理解

2025/08/18

Positional Encoding

2025/08/18

AI alignment

AI alignment（人工智慧對齊）是一個研究領域，目標是確保人工智慧系統的行為和結果符合人類的意圖、價值觀和目標。換句話說，就是讓 AI 的行動方向與人類設計者或使用者真正想要達成的目標保持一致，避免 AI 產生不符合預期甚至危害性的行為。為什麼 AI alignment 重要？ •

2025/08/18

AI alignment

2025/08/18

Instruction fine-tuning

Instruction fine-tuning 是指對預訓練模型（例如 Stable Diffusion）進行微調，使模型能更好地理解並執行用戶的「指令」（instruction），即根據特定的描述或操作說明來生成對應的結果。具體解釋： • 傳統微調會針對特定任務或數據進行調整，但指令微調則

2025/08/18

Instruction fine-tuning

看更多

你可能也想看

趙鐸的沙龍

《轉轉生 Re:INCARNATION》：釋放差異的身體裂縫

長期以來，西方美學以《維特魯威人》式的幾何比例定義「完美身體」，這種視覺標準無形中成為殖民擴張與種族分類的暴力工具。本文透過分析奈及利亞編舞家庫德斯．奧尼奎庫的舞作《轉轉生》，探討當代非洲舞蹈如何跳脫「標本式」的文化觀看。

#2026北藝嚴選#北藝嚴選#臺北表演藝術中心

2026/02/28

趙鐸的沙龍

《轉轉生 Re:INCARNATION》：釋放差異的身體裂縫

#2026北藝嚴選#北藝嚴選#臺北表演藝術中心

2026/02/28

Learn AI 不 BI

AI說書 - 從0開始 - 84

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。繼 AI說書 - 從0開始 - 82 與 xxx ，我們談論了衡量 AI 模型的方式，那當你訓練的模型比 State-of-the-Art 還要好並想要進行宣稱時，需要

#AI#ai#PromptEngineering

2024/07/12

Learn AI 不 BI

AI說書 - 從0開始 - 84

#AI#ai#PromptEngineering

2024/07/12

烽燧視覺 / FSVP的沙龍

深度理解虛擬製作

我們將從四個角度切入，深度理解虛擬製作的核心主題與模式

#虛擬製作#烽燧視覺#fsvp

2024/03/07

烽燧視覺 / FSVP的沙龍

深度理解虛擬製作

我們將從四個角度切入，深度理解虛擬製作的核心主題與模式

#虛擬製作#烽燧視覺#fsvp

2024/03/07

dab戴伯的沙龍

生成式對抗網路GAN

這篇文章探討了生成式對抗網路中機率分佈的使用與相關的訓練方式，包括Generator不同的點、Distriminator的訓練過程、生成圖片的條件設定等。此外，也提到了GAN訓練的困難與解決方式以及不同的learning方式。文章內容豐富且詳細，涵蓋了GAN的各個相關面向。

2024/05/15

2024/05/15

筆記-深度學習模型訓練：利用殘差網路做影像辨識

前言讀了許多理論，是時候實際動手做做看了，以下是我的模型訓練初體驗，有點糟就是了XD。正文 def conv(filters, kernel_size, strides=1): return Conv2D(filters, kernel_size,

#深度學習#AI#人工智慧

2024/07/23

柴郡貓姍蒂的沙龍

筆記-深度學習模型訓練：利用殘差網路做影像辨識

#深度學習#AI#人工智慧

2024/07/23

仁和的論文整理

AI影像論文(06)：AI如何生成影片?Diffusion模型生成影片方法調查

此篇調查論文探討了Diffusion模型在文字、圖片和聲音轉換為影片，以及影片衍生和編輯的應用類型。作者也介紹了U-Net架構和Vision Transformer等生成圖像架構，並詳細探討了訓練模型的方法以及不同的影像資料集來源。

#模型#視頻#數據

2024/07/05

仁和的論文整理

AI影像論文(06)：AI如何生成影片?Diffusion模型生成影片方法調查

#模型#視頻#數據

2024/07/05

Amily的沙龍

在理解與拒絕之間：從多重身分觀看《海妲．蓋柏樂》

若說易卜生的《玩偶之家》為 19 世紀的女性，開啟了一扇離家的窄門，那麼《海妲．蓋柏樂》展現的便是門後的窒息世界。本篇文章由劇場演員 Amily 執筆，同為熟稔文本的演員，亦是深刻體察制度縫隙的當代女性，此文所看見的不僅僅是崩壞前夕的最後發聲，更是女人被迫置於冷酷的制度之下，步步陷入無以言說的困境。

#2026北藝嚴選#北藝嚴選#臺北表演藝術中心

2026/02/28