Artificial Intelligence 自學筆記(2)——Deep Learning是什麼?從機器學習到深度學習

更新 發佈閱讀 6 分鐘
vocus|新世代的創作平台


前一篇整理的是 Machine Learning(機器學習)的基本概念
以及 AI(人工智慧)如何透過資料學習規律來做出預測:

機器是透過資料學習規律來做出預測。
但這樣的學習方式,其實還有一個很大的限制是,
機器能理解的「特徵」,往往還是需要人類先幫它定義。

——Deep Learning的問世,就是為了讓機器能夠自己從資料中學習,
而不需要人類事先定義特徵。

從整體架構來看,Deep Learning 是 Machine Learning 的一部分

從整體架構來看,Deep Learning 是 Machine Learning 的一部分



Deep Learning(深度學習) 是什麼?在做什麼?

那麼,Deep Learning 是怎麼做到這件事的呢?

簡單來說,Deep Learning 是 Machine Learning 的一種方法,
它透過多層的神經網路,讓機器可以從資料中逐層學習出不同層次的特徵。
如果說 Machine Learning 需要人類告訴機器該看什麼,
那麼 Deep Learning 想做的,就是讓機器自己決定該看什麼。

換句話說,Deep Learning 不是只學習結果,
而是連「如何理解資料」這件事,也交給機器自己去完成。

例如,在判斷一張圖片裡的動物是貓還是狗時,
傳統的 Machine Learning 可能需要人類先定義一些特徵,
像是「耳朵的形狀」、「臉部的輪廓」或「邊緣的變化」,
再讓模型根據這些特徵來判斷圖片中的動物種類。

但在 Deep Learning 中,模型可以從原始的像素資料開始,
逐層學習並自行組合出這些特徵, 最終完成辨識是貓還是狗。


Deep Learning 是怎麼做到的?多層神經網路的運作原理

那麼,模型是怎麼從原始的像素資料,
一步一步學會這些特徵的呢?

——這背後的關鍵,其實就是所謂的「多層神經網路」——

所謂的「多層」,指的是模型會經過一層一層的處理,
每一層都會從前一層的結果中,抽取出更進一步的特徵。
例如,第一層可能只學到簡單的線條與邊緣,
接下來的層則會逐漸組合出形狀、輪廓,
再往上則可能形成像「耳朵」、「眼睛」這樣的結構,
最終才能辨識出整體是貓還是狗。

其實我在看教材的時候,
一直也無法理解為什麼透過這樣的設計,
就可以讓機器「學會自我學習」。
科學家們會給出很多理論式的解說,
但我始終覺得好像還有哪裡沒有被說明到的感覺。

但由於神經網路的設計概念源自於人類大腦,
或許就像我們至今仍無法完全理解大腦的運作方式一樣,
科學家也無法明確解釋,
Deep Learning 從輸入到輸出之間,究竟是如何做出決策的。

這樣的過程通常被稱為「黑箱模型(Black Box)」。

對我來說,在理解到某個程度之後,
與其不斷追問它「為什麼能這樣運作」,
我傾向先接受一個事實——

它確實可以運作,而且效果還不錯。

即使我們無法完全理解其中的決策細節,
AI還是非常好用的工具。

vocus|新世代的創作平台



Deep Learning 的常見模型與應用

在理解了 Deep Learning 的基本運作方式之後,
那麼,它在實際應用中又是如何被使用的呢?

人類可以用同一套大腦處理不同類型的問題,
但對於 AI 來說,
通常需要根據任務的特性,
使用不同的模型來處理不同形式的資料。

因此,在實際應用中,
也發展出了各種不同的模型架構,
讓機器可以處理不同類型的資料與任務。

常見的 Deep Learning 模型如下圖所示:

vocus|新世代的創作平台

這些模型並不是彼此競爭的關係,
而是根據不同的資料形式與問題,發展出各自擅長的方向。

例如,在影像相關的任務中,
常會使用 CNN(Convolutional Neural Network,卷積神經網路),
透過卷積運算來抓取圖片中的空間特徵。

而在時間序列或語言處理的任務中,
RNN(Recurrent Neural Network,循環神經網路)
則擅長處理具有前後關係的資料。

至於近年最重要的架構之一 Transformer(轉換器架構),
則大幅提升了自然語言處理的能力,
是目前許多大型語言模型(例如 ChatGPT)背後的核心技術。

另外,在生成內容的任務中,
常會使用 GAN(Generative Adversarial Network,生成對抗網路),
透過兩個模型之間的對抗學習,
讓機器能夠生成出看起來接近真實的影像或資料。


在實際應用中,
這些模型也不一定是單獨使用的。
許多 AI 系統,往往會結合多種不同的模型,
讓各自擅長的能力彼此配合。

例如,在自動駕駛系統中,
可能會使用 CNN 來進行影像辨識, 判斷道路、車輛與行人;
同時再搭配其他模型來處理路徑規劃或決策,
讓整個系統能夠做出更完整的判斷。

也就是說,Deep Learning 不只是單一模型的運作,
更常見的是多種模型共同組成一個系統。


AI / All Around You

在多數時候,我們並不會特別意識到這些技術的存在。

就像電影播放前,那段低聲的音效示範帶,
“all… around… you”,
聲音從不同方向悄悄出現,卻不容易被單獨注意。

AI 也是如此。
它並不總是以顯眼的形式存在,
卻早已分散在我們生活的各個角落。

或許,在你沒有特別留意的時候,
它就已經在影響你看到的內容、做出的選擇,
甚至是你與世界互動的方式。

——AI, all around you.


vocus|新世代的創作平台



👉 延伸閱讀:

如果你想先理解 Machine Learning,可以參考這篇:
Artificial Intelligence 自學筆記(1)——什麼是 Machine Learning?

留言
avatar-img
ReiY的沙龍
2會員
4內容數
什麼都寫一點。 有時候是學習,有時候只是生活, 也可能只是某一天突然想明白了一件事。
ReiY的沙龍的其他內容
2026/04/09
重新整理自己對人工智慧的理解。從圖靈測驗的定義出發,釐清 AI 的兩種發展路線:Symbolic AI 與 Data Driven AI還有Machine Learning、概念與學習方式,包含監督學習、非監督學習與強化學習,。
Thumbnail
2026/04/09
重新整理自己對人工智慧的理解。從圖靈測驗的定義出發,釐清 AI 的兩種發展路線:Symbolic AI 與 Data Driven AI還有Machine Learning、概念與學習方式,包含監督學習、非監督學習與強化學習,。
Thumbnail
2026/03/31
原本覺得AI概念都長得很像,看了很多圖還是有點混亂。後來試著自己重畫架構,才發現問題其實是不同層次被混在一起。這篇就是我從「好像懂了」到「比較能說清楚」的整理過程。
Thumbnail
2026/03/31
原本覺得AI概念都長得很像,看了很多圖還是有點混亂。後來試著自己重畫架構,才發現問題其實是不同層次被混在一起。這篇就是我從「好像懂了」到「比較能說清楚」的整理過程。
Thumbnail
2026/03/24
文組背景,三個月自學準備 AI 證照,並同時報考 iPAS AI 應用規劃師與生成式 AI 能力認證。 這篇記錄我的準備過程、學習方法與考試心得, 也分享文組如何建立 AI 知識架構,以及如何在 AI 時代找到自己的位置。
Thumbnail
2026/03/24
文組背景,三個月自學準備 AI 證照,並同時報考 iPAS AI 應用規劃師與生成式 AI 能力認證。 這篇記錄我的準備過程、學習方法與考試心得, 也分享文組如何建立 AI 知識架構,以及如何在 AI 時代找到自己的位置。
Thumbnail
看更多
你可能也想看
Thumbnail
近期,《 麻省理工科技評論 》( MIT Technology Review )一篇關於中東地緣政治的最新探討引起市場的廣泛關注:AI 正在將伊朗衝突變成一場「 劇場 」( Theater )。
Thumbnail
近期,《 麻省理工科技評論 》( MIT Technology Review )一篇關於中東地緣政治的最新探討引起市場的廣泛關注:AI 正在將伊朗衝突變成一場「 劇場 」( Theater )。
Thumbnail
AI 能理解文字與生成圖像,其實不是魔法,而是依靠一系列精巧的核心組件。本篇帶你走進神機營的「機關解剖室」,用武俠比喻拆解 AI 大腦運作:從將文字轉為數值座標的 Embedding,到理解上下文的 Attention 與 Self-Attention,再到生成圖像的潛在空間與 GAN 對抗機制。
Thumbnail
AI 能理解文字與生成圖像,其實不是魔法,而是依靠一系列精巧的核心組件。本篇帶你走進神機營的「機關解剖室」,用武俠比喻拆解 AI 大腦運作:從將文字轉為數值座標的 Embedding,到理解上下文的 Attention 與 Self-Attention,再到生成圖像的潛在空間與 GAN 對抗機制。
Thumbnail
本文分析導演巴里・柯斯基(Barrie Kosky)如何運用極簡的舞臺配置,將布萊希特(Bertolt Brecht)的「疏離效果」轉化為視覺奇觀與黑色幽默,探討《三便士歌劇》在當代劇場中的新詮釋,並藉由舞臺、燈光、服裝、音樂等多方面,分析該作如何在保留批判核心的同時,觸及觀眾的觀看位置與人性幽微。
Thumbnail
本文分析導演巴里・柯斯基(Barrie Kosky)如何運用極簡的舞臺配置,將布萊希特(Bertolt Brecht)的「疏離效果」轉化為視覺奇觀與黑色幽默,探討《三便士歌劇》在當代劇場中的新詮釋,並藉由舞臺、燈光、服裝、音樂等多方面,分析該作如何在保留批判核心的同時,觸及觀眾的觀看位置與人性幽微。
Thumbnail
近期,我在公司內部討論了關於大型語言模型(LLM)的導入問題,焦點在於應該選擇自建AI伺服器還是使用雲端服務。這個問題在生成式AI風氣盛行的今日,顯得尤為重要。企業在選擇語言模型進行微調,或是語言模型搭配使用檢索增強生成(RAG)模式時,面臨AI基礎建設的選擇主要會是考量自建AI伺服器或採用雲端
Thumbnail
近期,我在公司內部討論了關於大型語言模型(LLM)的導入問題,焦點在於應該選擇自建AI伺服器還是使用雲端服務。這個問題在生成式AI風氣盛行的今日,顯得尤為重要。企業在選擇語言模型進行微調,或是語言模型搭配使用檢索增強生成(RAG)模式時,面臨AI基礎建設的選擇主要會是考量自建AI伺服器或採用雲端
Thumbnail
《轉轉生》(Re:INCARNATION)為奈及利亞編舞家庫德斯.奧尼奎庫與 Q 舞團創作的當代舞蹈作品,結合拉各斯街頭節奏、Afrobeat/Afrobeats、以及約魯巴宇宙觀的非線性時間,建構出關於輪迴的「誕生—死亡—重生」儀式結構。本文將從約魯巴哲學概念出發,解析其去殖民的身體政治。
Thumbnail
《轉轉生》(Re:INCARNATION)為奈及利亞編舞家庫德斯.奧尼奎庫與 Q 舞團創作的當代舞蹈作品,結合拉各斯街頭節奏、Afrobeat/Afrobeats、以及約魯巴宇宙觀的非線性時間,建構出關於輪迴的「誕生—死亡—重生」儀式結構。本文將從約魯巴哲學概念出發,解析其去殖民的身體政治。
Thumbnail
背景:從冷門配角到市場主線,算力與電力被重新定價   小P從2008進入股市,每一個時期的投資亮點都不同,記得2009蘋果手機剛上市,當時蘋果只要在媒體上提到哪一間供應鏈,隔天股價就有驚人的表現,當時光學鏡頭非常熱門,因為手機第一次搭上鏡頭可以拍照,也造就傳統相機廠的殞落,如今手機已經全面普及,題
Thumbnail
背景:從冷門配角到市場主線,算力與電力被重新定價   小P從2008進入股市,每一個時期的投資亮點都不同,記得2009蘋果手機剛上市,當時蘋果只要在媒體上提到哪一間供應鏈,隔天股價就有驚人的表現,當時光學鏡頭非常熱門,因為手機第一次搭上鏡頭可以拍照,也造就傳統相機廠的殞落,如今手機已經全面普及,題
Thumbnail
本週全球人工智慧產業進入了一個極具象徵意義的轉折點:從技術展示轉向深度的結構性轉型。隨著 Meta 傳出為抵銷高昂的 AI 基礎設施成本而計畫大幅裁員,以及 NVIDIA 宣布斥資 260 億美元開發開源模型以鞏固硬體生態,產業焦點已全面轉向 Agentic AI 的實際落地與硬體供應鏈的極限爭奪
Thumbnail
本週全球人工智慧產業進入了一個極具象徵意義的轉折點:從技術展示轉向深度的結構性轉型。隨著 Meta 傳出為抵銷高昂的 AI 基礎設施成本而計畫大幅裁員,以及 NVIDIA 宣布斥資 260 億美元開發開源模型以鞏固硬體生態,產業焦點已全面轉向 Agentic AI 的實際落地與硬體供應鏈的極限爭奪
Thumbnail
GenAI浪潮來襲,引發許多人焦慮,文章探討這種焦慮根源,分析GenAI的技術本質與應用模式,點出關鍵在於應用「GenAI+」思維,而非僅將其視為工具。文章並以案例說明如何重新定義工作流程,如何結合AI與傳統方法,提升生產力。最後,文章強調獨立思考的重要性,以及在GenAI時代定位自身價值的重要性。
Thumbnail
GenAI浪潮來襲,引發許多人焦慮,文章探討這種焦慮根源,分析GenAI的技術本質與應用模式,點出關鍵在於應用「GenAI+」思維,而非僅將其視為工具。文章並以案例說明如何重新定義工作流程,如何結合AI與傳統方法,提升生產力。最後,文章強調獨立思考的重要性,以及在GenAI時代定位自身價值的重要性。
Thumbnail
本篇以武俠情境解析生成式 AI 核心架構,介紹生成模型、GAN、VAE 與 Diffusion 等影像生成技術,並說明自回歸語言模型、遮罩語言模型與多模態模型在圖文生成任務中的應用。透過造物陣法譜系,協助理解條件生成與潛在擴散模型的運作原理,建立生成式 AI 模型基礎概念。
Thumbnail
本篇以武俠情境解析生成式 AI 核心架構,介紹生成模型、GAN、VAE 與 Diffusion 等影像生成技術,並說明自回歸語言模型、遮罩語言模型與多模態模型在圖文生成任務中的應用。透過造物陣法譜系,協助理解條件生成與潛在擴散模型的運作原理,建立生成式 AI 模型基礎概念。
Thumbnail
本篇以武俠情境解析 AI 大腦架構,介紹 CNN、RNN 與 Transformer 在處理影像與序列資料時的差異。透過情報陣法失靈案例,說明長距離依賴問題與自注意力機制,並延伸至 Transformer-XL 與自編碼器在長文本處理與資料壓縮上的應用,協助建立生成式 AI 核心模型理解。
Thumbnail
本篇以武俠情境解析 AI 大腦架構,介紹 CNN、RNN 與 Transformer 在處理影像與序列資料時的差異。透過情報陣法失靈案例,說明長距離依賴問題與自注意力機制,並延伸至 Transformer-XL 與自編碼器在長文本處理與資料壓縮上的應用,協助建立生成式 AI 核心模型理解。
Thumbnail
從 AI 基礎到系統架構與治理,White-Lab 用 144 張名詞卡帶你建立完整 AI 知識地圖,讓你真正看懂人工智慧,而不是只會使用工具。
Thumbnail
從 AI 基礎到系統架構與治理,White-Lab 用 144 張名詞卡帶你建立完整 AI 知識地圖,讓你真正看懂人工智慧,而不是只會使用工具。
Thumbnail
這是一場修復文化與重建精神的儀式,觀眾不需要完全看懂《遊林驚夢:巧遇Hagay》,但你能感受心與土地團聚的渴望,也不急著在此處釐清或定義什麼,但你的在場感受,就是一條線索,關於如何找著自己的路徑、自己的聲音。
Thumbnail
這是一場修復文化與重建精神的儀式,觀眾不需要完全看懂《遊林驚夢:巧遇Hagay》,但你能感受心與土地團聚的渴望,也不急著在此處釐清或定義什麼,但你的在場感受,就是一條線索,關於如何找著自己的路徑、自己的聲音。
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News