B 航線:半監督式學習的折衷智慧

王一書-avatar-img
發佈於AI-900 認證輔導 個房間
更新 發佈閱讀 4 分鐘
vocus|新世代的創作平台

[場景]

小美是資料標註員,負責辨識圖像資料並加上標籤,然後交給工程師進行模型訓練。
眼看已經接近下午5點,可是尚未標註的資料還有很多……

vocus|新世代的創作平台

一、標籤不夠,是現實世界的常態

想像你要訓練一個「動物辨識模型」。
你有:

    • 100 張已經人工標記好的圖片(有標籤)
    • 20,000 張沒標籤的圖片

問題來了:

    • 只用 100 張可以訓練嗎?資料太少。
    • 全部人工標註?成本太高。

這時候,就會發現:

使用監督式學習(Supervised Learning),資料必須全部都有標籤。
使用非監督式學習(Unsupervised Learning)又無法達到分類效果。

於是,出現了第三種學習方式。


二、什麼是半監督式學習(Semi-Supervised Learning)?

半監督式學習的核心概念很簡單:

少量有標記資料 + 大量未標記資料的學習方式。

它的概念是:

  1. 先用少量已標註資料訓練一個初步模型
  2. 再讓模型去「推測」大量未標記的資料標籤
  3. 把可信的結果匯整,加入訓練資料中

簡單說:

用已知的,擴張未知的。
這種作法在技術上常被稱為「偽標籤(Pseudo-label)」「自我訓練(Self-training)」策略。


三、它跟其他學習方式有什麼不同?

監督式學習:
✔資料全部需要標註
✔適合資料已標註並且數量充足

非監督式學習
✔資料不需要標註
✔適合依相似特性做分群

半監督式學習
✔少量已標註的資料
✔適合用在標註成本昂貴、資料數量多

可以把它想成:

監督式與非監督式的「混血策略」


四、常見應用場景

半監督式學習最常出現在:

  • 📷 電腦視覺(Computer Vision)
  • 🗣 語音辨識
  • 🏥 醫療影像判讀
  • 🌐 網路內容分類

這些領域有一個共同點:

資料很多,但標註成本很貴、很花時間。

例如醫療影像,需要專業醫師標註。
不可能全部人工完成。


五、考試提示

考題通常不會深入演算法。(出現機率不大)

但是可能會這樣問:

「下列何者為半監督式學習的特徵?」

正確答案通常是:

使用少量標記資料與大量未標記資料


六、實務應用上,它仍是值得認識的

因為在真實的應用情境裡:

資料幾乎永遠是不完整的。

半監督式學習代表的是一種「現實妥協」。
它不是最理想的方法,
卻往往是最務實的選擇。


七、小結

機器學習的主要學習方式包含:

  • 監督式:標籤完整
  • 非監督式:完全無標籤
  • 半監督式:現實世界的折衷解法

到這裡,我們已經把「機器學習的模型」介紹的差不多了。

但請留意:

挑對模型,只是成功的一部分。
真正影響結果的,往往是資料本身。


▶ Next:下一篇,我們該來談談——

👉 為什麼資料清理,比模型選擇更重要?


課程說明

🔖 以下內容為本系列的學習安排與閱讀指引。

  1. 為方便大家學習,我將全部章節進行劃分,詳見導覽文
  2. 本系列文章區分為「免費文」與「收費文」,
    目的在於清楚分開「初步認識」與「深入理解」兩個學習階段。
    收費內容將在基礎概念之上,整合重點圖表與說明,並融入個人教學與應考經驗,
    協助讀者建立可實際運用的理解框架。
  3. 各系列的收費文章皆以「考試情境」為主軸進行整理,
    不僅補齊必要的模型原理與判斷邏輯,
    亦會搭配模擬題與選項解析,
    協助學習者從「看懂內容」,進一步轉化為「選得正確」。
vocus|新世代的創作平台


留言
avatar-img
書子 的 AI 應用筆記
3會員
21內容數
這是一個關於「理解」與「實作」的學習沙龍。 我會分享程式與 AI 認證的學習脈絡,拆解考點背後的邏輯, 幫助學習者在快速變動的科技環境中,建立真正可用的能力。 這個沙龍適合: ・正在準備程式或 AI 相關認證的人 ・剛開始學程式,卻覺得觀念零散的人 ・轉職中,希望打好基礎、不想只追流行名詞的人
2026/02/26
集成學習(Ensemble Learning)可透過結合多個弱學習器,有效提升預測穩定度與準確率。本文整理三大核心方法:Bagging、Boosting 與 Stacking,同時比較隨機森林、AdaBoost、XGBoost 等代表演算法。幫助讀者建立清晰的判斷邏輯,並依情境選擇合適策略。
Thumbnail
2026/02/26
集成學習(Ensemble Learning)可透過結合多個弱學習器,有效提升預測穩定度與準確率。本文整理三大核心方法:Bagging、Boosting 與 Stacking,同時比較隨機森林、AdaBoost、XGBoost 等代表演算法。幫助讀者建立清晰的判斷邏輯,並依情境選擇合適策略。
Thumbnail
2026/02/09
三個臭皮匠,勝過一個諸葛亮。 集成學習(Ensemble Learning)的核心想法,其實很直覺:不要只聽一個聲音,而是讓多個模型一起做判斷。 它不是新的學習類型,而是一種能提升模型泛化能力的重要策略,也是 B 航線中一定要理解的關鍵概念。
Thumbnail
2026/02/09
三個臭皮匠,勝過一個諸葛亮。 集成學習(Ensemble Learning)的核心想法,其實很直覺:不要只聽一個聲音,而是讓多個模型一起做判斷。 它不是新的學習類型,而是一種能提升模型泛化能力的重要策略,也是 B 航線中一定要理解的關鍵概念。
Thumbnail
2026/02/09
非監督式學習,是在沒有標準答案的情況下,協助我們整理資料本身的結構。它回答三個核心問題:哪些資料彼此相似、哪些特徵才是真正重要、哪些事件常常一起發生。 本文從「聚類分析」、「降維技術」到「關聯規則學習」,帶你建立非監督式學習的整體理解框架,理解 AI 如何先整理資料,再由人來解讀意義。
Thumbnail
2026/02/09
非監督式學習,是在沒有標準答案的情況下,協助我們整理資料本身的結構。它回答三個核心問題:哪些資料彼此相似、哪些特徵才是真正重要、哪些事件常常一起發生。 本文從「聚類分析」、「降維技術」到「關聯規則學習」,帶你建立非監督式學習的整體理解框架,理解 AI 如何先整理資料,再由人來解讀意義。
Thumbnail
看更多
你可能也想看
Thumbnail
背景:從冷門配角到市場主線,算力與電力被重新定價   小P從2008進入股市,每一個時期的投資亮點都不同,記得2009蘋果手機剛上市,當時蘋果只要在媒體上提到哪一間供應鏈,隔天股價就有驚人的表現,當時光學鏡頭非常熱門,因為手機第一次搭上鏡頭可以拍照,也造就傳統相機廠的殞落,如今手機已經全面普及,題
Thumbnail
背景:從冷門配角到市場主線,算力與電力被重新定價   小P從2008進入股市,每一個時期的投資亮點都不同,記得2009蘋果手機剛上市,當時蘋果只要在媒體上提到哪一間供應鏈,隔天股價就有驚人的表現,當時光學鏡頭非常熱門,因為手機第一次搭上鏡頭可以拍照,也造就傳統相機廠的殞落,如今手機已經全面普及,題
Thumbnail
AI-900 X 學習筆記 X 英文專有名詞對照 迴歸模型就是用來預測數值的工具,它會依據訓練資料中已知的特徵與已知的標籤(答案)來學習。 本文包含:迴歸模型原理、如何評估模型好壞?
Thumbnail
AI-900 X 學習筆記 X 英文專有名詞對照 迴歸模型就是用來預測數值的工具,它會依據訓練資料中已知的特徵與已知的標籤(答案)來學習。 本文包含:迴歸模型原理、如何評估模型好壞?
Thumbnail
AI900 X 學習筆記 X 英文名詞對照 分群(叢集)為非監督式學習,不需要使用標籤好的資料進行訓練,模型觀察數值或特徵的相似性來分組。 考試的重點:何種情況下使用分群?
Thumbnail
AI900 X 學習筆記 X 英文名詞對照 分群(叢集)為非監督式學習,不需要使用標籤好的資料進行訓練,模型觀察數值或特徵的相似性來分組。 考試的重點:何種情況下使用分群?
Thumbnail
本文分析導演巴里・柯斯基(Barrie Kosky)如何運用極簡的舞臺配置,將布萊希特(Bertolt Brecht)的「疏離效果」轉化為視覺奇觀與黑色幽默,探討《三便士歌劇》在當代劇場中的新詮釋,並藉由舞臺、燈光、服裝、音樂等多方面,分析該作如何在保留批判核心的同時,觸及觀眾的觀看位置與人性幽微。
Thumbnail
本文分析導演巴里・柯斯基(Barrie Kosky)如何運用極簡的舞臺配置,將布萊希特(Bertolt Brecht)的「疏離效果」轉化為視覺奇觀與黑色幽默,探討《三便士歌劇》在當代劇場中的新詮釋,並藉由舞臺、燈光、服裝、音樂等多方面,分析該作如何在保留批判核心的同時,觸及觀眾的觀看位置與人性幽微。
Thumbnail
AI-900系列 X 筆記整理 X 心智圖 機器學習(Machine Learning),基本概念就是用過去觀察的資料,預測未知的結果或值。例如:冰淇淋店結合歷史銷售數據+天氣紀錄,根據天氣預測,推測未來銷售額。 什麼是監督式學習與非監督式學習?分類和分群怎麼辨別?
Thumbnail
AI-900系列 X 筆記整理 X 心智圖 機器學習(Machine Learning),基本概念就是用過去觀察的資料,預測未知的結果或值。例如:冰淇淋店結合歷史銷售數據+天氣紀錄,根據天氣預測,推測未來銷售額。 什麼是監督式學習與非監督式學習?分類和分群怎麼辨別?
Thumbnail
AI900學習筆記 X 考題重點 X 英文名詞對照 分類模型和迴歸模型一樣,都是監督式機器學習(Supervised ML),不同的是,迴歸模型預測的是數值,而分類模型是判斷某個資料點屬於哪一類。 了解分類模型,以及如何評估分類模型的優劣。
Thumbnail
AI900學習筆記 X 考題重點 X 英文名詞對照 分類模型和迴歸模型一樣,都是監督式機器學習(Supervised ML),不同的是,迴歸模型預測的是數值,而分類模型是判斷某個資料點屬於哪一類。 了解分類模型,以及如何評估分類模型的優劣。
Thumbnail
純血文組生,如何從零基礎開始,接連考取 iPAS AI 應用規劃師、資策會人工智慧工程素養認證、生成式 AI 能力認證,和 Microsoft AI-900 國際認證的完整心得。文章包含各證照的考試範圍、難易度評估、學習資源,以及實際準備過程與備考策略,希望能幫助想踏入 AI 領域的讀者少走冤枉路。
Thumbnail
純血文組生,如何從零基礎開始,接連考取 iPAS AI 應用規劃師、資策會人工智慧工程素養認證、生成式 AI 能力認證,和 Microsoft AI-900 國際認證的完整心得。文章包含各證照的考試範圍、難易度評估、學習資源,以及實際準備過程與備考策略,希望能幫助想踏入 AI 領域的讀者少走冤枉路。
Thumbnail
《轉轉生》(Re:INCARNATION)為奈及利亞編舞家庫德斯.奧尼奎庫與 Q 舞團創作的當代舞蹈作品,結合拉各斯街頭節奏、Afrobeat/Afrobeats、以及約魯巴宇宙觀的非線性時間,建構出關於輪迴的「誕生—死亡—重生」儀式結構。本文將從約魯巴哲學概念出發,解析其去殖民的身體政治。
Thumbnail
《轉轉生》(Re:INCARNATION)為奈及利亞編舞家庫德斯.奧尼奎庫與 Q 舞團創作的當代舞蹈作品,結合拉各斯街頭節奏、Afrobeat/Afrobeats、以及約魯巴宇宙觀的非線性時間,建構出關於輪迴的「誕生—死亡—重生」儀式結構。本文將從約魯巴哲學概念出發,解析其去殖民的身體政治。
Thumbnail
AI900 X Azure ML 實作流程 X 考題重點 Microsoft Azure Machine Learning是微軟的雲端平台,用於訓練、部屬、管理機器學習模型,本文透過微軟的學習範例,一步步帶你建立自動化機器學習。
Thumbnail
AI900 X Azure ML 實作流程 X 考題重點 Microsoft Azure Machine Learning是微軟的雲端平台,用於訓練、部屬、管理機器學習模型,本文透過微軟的學習範例,一步步帶你建立自動化機器學習。
Thumbnail
網頁揭示了 AI-900 考試中文測試練習題庫的翻譯問題,指出不準確的翻譯可能導致考生對題目理解不足,並可能誤判答案。作者整理了一系列官方中文翻譯,提供了清晰的常見譯法和涵義,以及備考過程中的提醒,以幫助考生避免這些陷阱,並有效率地通過考試。
Thumbnail
網頁揭示了 AI-900 考試中文測試練習題庫的翻譯問題,指出不準確的翻譯可能導致考生對題目理解不足,並可能誤判答案。作者整理了一系列官方中文翻譯,提供了清晰的常見譯法和涵義,以及備考過程中的提醒,以幫助考生避免這些陷阱,並有效率地通過考試。
Thumbnail
AI900 X 學習筆記 X 英文名詞對照 機器學習、深度學習的名詞已紅了多年,到底是在"Deep"什麼? 深度學習(Deep Learning)是一種模仿人類大腦運作方式的機器學習方法。它透過建立人工神經網路(ANN),以數學函式模擬生物神經元的活動。
Thumbnail
AI900 X 學習筆記 X 英文名詞對照 機器學習、深度學習的名詞已紅了多年,到底是在"Deep"什麼? 深度學習(Deep Learning)是一種模仿人類大腦運作方式的機器學習方法。它透過建立人工神經網路(ANN),以數學函式模擬生物神經元的活動。
Thumbnail
這是一場修復文化與重建精神的儀式,觀眾不需要完全看懂《遊林驚夢:巧遇Hagay》,但你能感受心與土地團聚的渴望,也不急著在此處釐清或定義什麼,但你的在場感受,就是一條線索,關於如何找著自己的路徑、自己的聲音。
Thumbnail
這是一場修復文化與重建精神的儀式,觀眾不需要完全看懂《遊林驚夢:巧遇Hagay》,但你能感受心與土地團聚的渴望,也不急著在此處釐清或定義什麼,但你的在場感受,就是一條線索,關於如何找著自己的路徑、自己的聲音。
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News