擴散模型(Diffusion Models)簡介

更新 發佈閱讀 2 分鐘

擴散模型受非均衡熱力學啟發。非均衡熱力學定義了一個擴散步驟的馬可夫鏈,逐步向資料添加隨機資訊,然後學習如何逆轉擴散過程,從隨機資訊中建構所需的樣本資料。與變分自編碼器(VAE)或以流為基礎的模型不同,擴散模型是通過固定程序學習的,且其潛在變量具有高維度(與原始資料相同)。


幾種基於擴散模型的生成式模型已被提出,它們的基本理念相似,包括擴散機率模型(Sohl-Dickstein等人,2015年)、條件干擾分數網路(NCSN;Yang和Ermon,2019年),以及去噪擴散概率模型(DDPM;Ho等人,2020年)。四種生成模型的示意圖比較,從上到下分別是:生成對抗網路(GAN)、變分自編碼器(VAE)、流模型和擴散模型。


不同類型的生成模型

不同類型的生成模型

給定一個從真實數據分佈中取樣的數據點 x_0,讓我們定義一個前向擴散過程,在這個過程中,我們在 T 個步驟中向樣本添加少量高斯噪訊,產生一系列噪訊樣本 x_1,…,x_T​。步長由方差時間表 β_1,…,β_Tβ1​,…,βT​ 控制。

q(xt∣xt−1)=N(xt;1−βtxt−1,βtI)q(xt​∣xt−1​)=N(xt​;1−βt​​xt−1​,βt​I)

隨著步驟 t 變大,數據樣本 x_0​ 逐漸失去其可辨識的特徵。最終當 t→T 時,x_T​ 等同於一個各向同性的高斯分佈。

留言
avatar-img
Kiki的沙龍
10會員
115內容數
心繫正體中文的科學家,立志使用正體中文撰寫文章。 此沙龍預計涵蓋各項資訊科技知識分享與學習心得
Kiki的沙龍的其他內容
2025/04/27
Meta 推出了開源大型語言模型 Llama。這一代特別引人注目,因為 80 億參數的模型小到可以在家用電腦上運行,效能卻不輸比它大十倍的模型。在許多應用場景下,它給出的回應品質已經能媲美 GPT-4。在這篇文章裡,我會說明自架 Llama 3 的優缺點,並提供設定方式與資源,讓讀者也能輕鬆動手。
2025/04/27
Meta 推出了開源大型語言模型 Llama。這一代特別引人注目,因為 80 億參數的模型小到可以在家用電腦上運行,效能卻不輸比它大十倍的模型。在許多應用場景下,它給出的回應品質已經能媲美 GPT-4。在這篇文章裡,我會說明自架 Llama 3 的優缺點,並提供設定方式與資源,讓讀者也能輕鬆動手。
2025/04/20
這份實務指引旨在協助產品和工程團隊入門 大型語言模型(LLM)驅動的人工智慧代理人建構,它定義了代理的核心概念,例如獨立執行任務和利用 LLM 管理工作流程決策。本文闡述了何時應考慮建立代理,特別是在傳統自動化方法受限的複雜情境,並深入探討了代理設計的基礎要素,包括模型選擇、工具整合及指令設置。
2025/04/20
這份實務指引旨在協助產品和工程團隊入門 大型語言模型(LLM)驅動的人工智慧代理人建構,它定義了代理的核心概念,例如獨立執行任務和利用 LLM 管理工作流程決策。本文闡述了何時應考慮建立代理,特別是在傳統自動化方法受限的複雜情境,並深入探討了代理設計的基礎要素,包括模型選擇、工具整合及指令設置。
2025/04/06
這篇文章將搭配簡單的範例,介紹最近推出的 Docker Model Runner。內容比較隨意粗略,希望能成為讓讀者了解這項工具的契機!
2025/04/06
這篇文章將搭配簡單的範例,介紹最近推出的 Docker Model Runner。內容比較隨意粗略,希望能成為讓讀者了解這項工具的契機!
看更多
你可能也想看
Thumbnail
分類原則請參照這篇 狹義來說,我們把建模視為幾何建模的簡寫,但是廣義來說他應該是會包含發熱體行為,風扇行為,所有會影響到各方程式架設的因子。也就是說如果我們今天以最基本熱流模型,那就會有流的建模和熱的建模。 雖然說是流體建模,但是實際上卻是畫固體邊界,然後不屬於固體的部分通通是流體。一般概
Thumbnail
分類原則請參照這篇 狹義來說,我們把建模視為幾何建模的簡寫,但是廣義來說他應該是會包含發熱體行為,風扇行為,所有會影響到各方程式架設的因子。也就是說如果我們今天以最基本熱流模型,那就會有流的建模和熱的建模。 雖然說是流體建模,但是實際上卻是畫固體邊界,然後不屬於固體的部分通通是流體。一般概
Thumbnail
上一篇簡介了紊流和故事的發生經過: 紊流二三事 -認識紊流 這一篇來稍微深入一點介紹紊流模型。要介紹紊流模型,得先從邊界層處理開始 不同RANS的描述版本,搭配壁面處理版本,產生了相當多種的紊流模型: 結束。
Thumbnail
上一篇簡介了紊流和故事的發生經過: 紊流二三事 -認識紊流 這一篇來稍微深入一點介紹紊流模型。要介紹紊流模型,得先從邊界層處理開始 不同RANS的描述版本,搭配壁面處理版本,產生了相當多種的紊流模型: 結束。
Thumbnail
本文分析導演巴里・柯斯基(Barrie Kosky)如何運用極簡的舞臺配置,將布萊希特(Bertolt Brecht)的「疏離效果」轉化為視覺奇觀與黑色幽默,探討《三便士歌劇》在當代劇場中的新詮釋,並藉由舞臺、燈光、服裝、音樂等多方面,分析該作如何在保留批判核心的同時,觸及觀眾的觀看位置與人性幽微。
Thumbnail
本文分析導演巴里・柯斯基(Barrie Kosky)如何運用極簡的舞臺配置,將布萊希特(Bertolt Brecht)的「疏離效果」轉化為視覺奇觀與黑色幽默,探討《三便士歌劇》在當代劇場中的新詮釋,並藉由舞臺、燈光、服裝、音樂等多方面,分析該作如何在保留批判核心的同時,觸及觀眾的觀看位置與人性幽微。
Thumbnail
如果有上過流體力學的話,對於這張圖大概並不陌生 層流 按照流場型態來分的話,我們可以把它分成3種,層流,過渡,以及紊流。 具體來說就是動量傳遞由黏滯力所主導的流況逐漸往由漩渦傳遞的一個過程。 而我們所熟悉的標準Navier-Stokes 方程組一般是適用在層流的條件之下。 非穩態層流 紊流
Thumbnail
如果有上過流體力學的話,對於這張圖大概並不陌生 層流 按照流場型態來分的話,我們可以把它分成3種,層流,過渡,以及紊流。 具體來說就是動量傳遞由黏滯力所主導的流況逐漸往由漩渦傳遞的一個過程。 而我們所熟悉的標準Navier-Stokes 方程組一般是適用在層流的條件之下。 非穩態層流 紊流
Thumbnail
本文章將介紹實務中進行HLM會需要注意的事項,包含樣本量要求、基本假設、計算解釋變異量和HLM建構策略。
Thumbnail
本文章將介紹實務中進行HLM會需要注意的事項,包含樣本量要求、基本假設、計算解釋變異量和HLM建構策略。
Thumbnail
之前已經說過限制模型,接下來進入下一部份根據Mulder and Hamaker (2021)建議,在 RI-CLPM 中,有許多擴展模型,今天要介紹的是 Extension 1。Extension 1就是加入跨時間不變的預測或結果變項,本文將介紹此模型構造和語法。
Thumbnail
之前已經說過限制模型,接下來進入下一部份根據Mulder and Hamaker (2021)建議,在 RI-CLPM 中,有許多擴展模型,今天要介紹的是 Extension 1。Extension 1就是加入跨時間不變的預測或結果變項,本文將介紹此模型構造和語法。
Thumbnail
《轉轉生》(Re:INCARNATION)為奈及利亞編舞家庫德斯.奧尼奎庫與 Q 舞團創作的當代舞蹈作品,結合拉各斯街頭節奏、Afrobeat/Afrobeats、以及約魯巴宇宙觀的非線性時間,建構出關於輪迴的「誕生—死亡—重生」儀式結構。本文將從約魯巴哲學概念出發,解析其去殖民的身體政治。
Thumbnail
《轉轉生》(Re:INCARNATION)為奈及利亞編舞家庫德斯.奧尼奎庫與 Q 舞團創作的當代舞蹈作品,結合拉各斯街頭節奏、Afrobeat/Afrobeats、以及約魯巴宇宙觀的非線性時間,建構出關於輪迴的「誕生—死亡—重生」儀式結構。本文將從約魯巴哲學概念出發,解析其去殖民的身體政治。
Thumbnail
連同上兩篇文章,我們介紹了機械學習裡的基石,並踩著這些基石了解了改變資料餵送方式,以及動態改變學習率或在更新項中加入動量的方法。我們可以看到這些梯度下降的變化,主要是解決兩個問題:梯度震盪和非最佳的局部最小值造成學習停滯不前的問題。在這篇文章中,我們著重動量和 Adam 的方法來達成克服以上的問題。
Thumbnail
連同上兩篇文章,我們介紹了機械學習裡的基石,並踩著這些基石了解了改變資料餵送方式,以及動態改變學習率或在更新項中加入動量的方法。我們可以看到這些梯度下降的變化,主要是解決兩個問題:梯度震盪和非最佳的局部最小值造成學習停滯不前的問題。在這篇文章中,我們著重動量和 Adam 的方法來達成克服以上的問題。
Thumbnail
這是一場修復文化與重建精神的儀式,觀眾不需要完全看懂《遊林驚夢:巧遇Hagay》,但你能感受心與土地團聚的渴望,也不急著在此處釐清或定義什麼,但你的在場感受,就是一條線索,關於如何找著自己的路徑、自己的聲音。
Thumbnail
這是一場修復文化與重建精神的儀式,觀眾不需要完全看懂《遊林驚夢:巧遇Hagay》,但你能感受心與土地團聚的渴望,也不急著在此處釐清或定義什麼,但你的在場感受,就是一條線索,關於如何找著自己的路徑、自己的聲音。
Thumbnail
背景:從冷門配角到市場主線,算力與電力被重新定價   小P從2008進入股市,每一個時期的投資亮點都不同,記得2009蘋果手機剛上市,當時蘋果只要在媒體上提到哪一間供應鏈,隔天股價就有驚人的表現,當時光學鏡頭非常熱門,因為手機第一次搭上鏡頭可以拍照,也造就傳統相機廠的殞落,如今手機已經全面普及,題
Thumbnail
背景:從冷門配角到市場主線,算力與電力被重新定價   小P從2008進入股市,每一個時期的投資亮點都不同,記得2009蘋果手機剛上市,當時蘋果只要在媒體上提到哪一間供應鏈,隔天股價就有驚人的表現,當時光學鏡頭非常熱門,因為手機第一次搭上鏡頭可以拍照,也造就傳統相機廠的殞落,如今手機已經全面普及,題
Thumbnail
此為蔡老師提供給修課學生的參考資料的handout,為Jure Leskovec 課程的Graph Neural Network投影片的簡略解說,在此分享給有興趣的同好。這可不是完整的介紹文章,請對照原投影片使用。
Thumbnail
此為蔡老師提供給修課學生的參考資料的handout,為Jure Leskovec 課程的Graph Neural Network投影片的簡略解說,在此分享給有興趣的同好。這可不是完整的介紹文章,請對照原投影片使用。
Thumbnail
感知器  (perceptron) 利用逐一探訪訓練資料,以更多的訓練例子被正確的分類為目標,來更新任意初始的權重。然而該方法難以延伸到非線性的分類平面,所以以梯度為主的最佳化演算法取而代之,並發展出更多的應用。在本篇中,除了介紹梯度下降法外,亦會討論如何利用學習曲線圖診斷一個機械模型,並對症下藥。
Thumbnail
感知器  (perceptron) 利用逐一探訪訓練資料,以更多的訓練例子被正確的分類為目標,來更新任意初始的權重。然而該方法難以延伸到非線性的分類平面,所以以梯度為主的最佳化演算法取而代之,並發展出更多的應用。在本篇中,除了介紹梯度下降法外,亦會討論如何利用學習曲線圖診斷一個機械模型,並對症下藥。
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News