交叉驗證(Cross-Validation)

更新 發佈閱讀 2 分鐘

交叉驗證(Cross-Validation)是一種機器學習中常用的模型評估和泛化能力測試方法,通過多次將數據分割成訓練集和驗證集,檢測模型在不同資料上的表現,以避免過擬合和選擇偏差,提高模型的穩健性。

交叉驗證的基本原理

  • 將數據集分成若干個子集(folds);
  • 每次用其中一個子集作為驗證集,其餘子集合併做訓練集;
  • 對模型進行訓練和評估,記錄性能指標;
  • 重複此過程直到每個子集都做過一次驗證集;
  • 將所有評估結果取平均,作為模型的最終性能估計。

常見交叉驗證方法

  1. k折交叉驗證(k-Fold Cross-Validation)
  • 將數據分為k個互不重疊的子集,通常k=5或10最常用,
  • 依次每一個子集做驗證集,其他k-1個子集做訓練,分別得出k次結果平均。
  • 平衡偏差與方差,穩健度較高。


  1. 留一交叉驗證(Leave-One-Out Cross-Validation, LOOCV)
  • 每次只拿出1個樣本作為驗證集,剩餘的所有樣本做訓練,
  • 對小數據集效果好,但運算代價高。


  1. 分層k折交叉驗證(Stratified k-Fold)
  • 保證每個折中各類別比例與整體數據一致,
  • 特別適用類別不平衡問題。


  1. 隨機重覆交叉驗證(Repeated Random Subsampling)
  • 隨機多次劃分訓練和驗證集,多次訓練和評估,結果穩定。

優點

  • 提供更可靠的模型性能估計,
  • 減少因訓練/驗證集劃分偶然性帶來的偏差,
  • 幫助選擇最佳模型與超參數。

缺點

  • 運算成本相對較高,
  • 不適合非常大規模數據集(計算時間長)。

總結來說,交叉驗證是透過多次數據劃分和訓練-測試循環,來更全面評估機器學習模型泛化能力的有效方法。它是模型選擇和性能評估中的基礎環節,能大幅提升模型的穩健性和可靠性。

留言
avatar-img
郝信華 iPAS AI應用規劃師 學習筆記
46會員
572內容數
現職 : 富邦建設資訊副理 證照:經濟部 iPAS AI應用規劃師 初級+中級(數據分析) AWS AIF-C01 AWS CLF-C02 Microsoft AI-900 其他:富邦美術館志工
2025/09/09
特徵選擇是機器學習中用來從原始特徵中挑選對目標變數最有影響力特徵的過程,能降低模型複雜度、提升預測效能及解釋性。常見的特徵選擇方法主要分成三大類: 1. 過濾法(Filter Methods) 原理:基於統計指標評估特徵與目標之間的相關性,獨立於任何學習模型。 常用指標:皮爾森相關係數、卡方檢
2025/09/09
特徵選擇是機器學習中用來從原始特徵中挑選對目標變數最有影響力特徵的過程,能降低模型複雜度、提升預測效能及解釋性。常見的特徵選擇方法主要分成三大類: 1. 過濾法(Filter Methods) 原理:基於統計指標評估特徵與目標之間的相關性,獨立於任何學習模型。 常用指標:皮爾森相關係數、卡方檢
2025/09/08
過採樣(Oversampling)是一種用於處理機器學習中類別不平衡問題的技術,主要通過增加少數類別的樣本數量,使得少數類和多數類的樣本比例更加均衡,從而改善模型對少數類的識別能力。 過採樣的主要方法 隨機過採樣(Random Oversampling): 從少數類樣本隨機有放回地抽取並複製,
2025/09/08
過採樣(Oversampling)是一種用於處理機器學習中類別不平衡問題的技術,主要通過增加少數類別的樣本數量,使得少數類和多數類的樣本比例更加均衡,從而改善模型對少數類的識別能力。 過採樣的主要方法 隨機過採樣(Random Oversampling): 從少數類樣本隨機有放回地抽取並複製,
2025/09/08
SMOTE(Synthetic Minority Over-sampling Technique,合成少數類別過採樣技術)是一種用於處理類別不平衡問題的數據增強方法,特別用於少數類別樣本數量較少時。它通過在少數類別樣本的特徵空間中生成合成樣本來擴充少數類別數據,幫助提升機器學習模型對少數類的識別效果
2025/09/08
SMOTE(Synthetic Minority Over-sampling Technique,合成少數類別過採樣技術)是一種用於處理類別不平衡問題的數據增強方法,特別用於少數類別樣本數量較少時。它通過在少數類別樣本的特徵空間中生成合成樣本來擴充少數類別數據,幫助提升機器學習模型對少數類的識別效果
看更多
你可能也想看
Thumbnail
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 回顧 AI說書 - 從0開始 - 87 說:Wang 等人 2019 年的論文,提供了合理答案的選擇 (Choice of Plausible Answers, COP
Thumbnail
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 回顧 AI說書 - 從0開始 - 87 說:Wang 等人 2019 年的論文,提供了合理答案的選擇 (Choice of Plausible Answers, COP
Thumbnail
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 延續 xxx 提到,既然提到訓練,就表示要有一套衡量基準供大家遵守,有鑑於此,以下繼續介紹幾類衡量方式: MCC: 首先介紹 True (T) Positive (
Thumbnail
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 延續 xxx 提到,既然提到訓練,就表示要有一套衡量基準供大家遵守,有鑑於此,以下繼續介紹幾類衡量方式: MCC: 首先介紹 True (T) Positive (
Thumbnail
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 回顧 AI說書 - 從0開始 - 87 說:Wang 等人 2019 年的論文,提供了合理答案的選擇 (Choice of Plausible Answers, COP
Thumbnail
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 回顧 AI說書 - 從0開始 - 87 說:Wang 等人 2019 年的論文,提供了合理答案的選擇 (Choice of Plausible Answers, COP
Thumbnail
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 延續 AI說書 - 從0開始 - 93 介紹了 The Corpus of Linguistic Acceptability (CoLA),其核心思想為:如果該句子在語
Thumbnail
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 延續 AI說書 - 從0開始 - 93 介紹了 The Corpus of Linguistic Acceptability (CoLA),其核心思想為:如果該句子在語
Thumbnail
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 回顧 AI說書 - 從0開始 - 129 中說,Bidirectional Encoder Representations from Transformers (BER
Thumbnail
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 回顧 AI說書 - 從0開始 - 129 中說,Bidirectional Encoder Representations from Transformers (BER
Thumbnail
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 回顧 AI說書 - 從0開始 - 87 說:Wang 等人 2019 年的論文,提供了合理答案的選擇 (Choice of Plausible Answers, COP
Thumbnail
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 回顧 AI說書 - 從0開始 - 87 說:Wang 等人 2019 年的論文,提供了合理答案的選擇 (Choice of Plausible Answers, COP
Thumbnail
若說易卜生的《玩偶之家》為 19 世紀的女性,開啟了一扇離家的窄門,那麼《海妲.蓋柏樂》展現的便是門後的窒息世界。本篇文章由劇場演員 Amily 執筆,同為熟稔文本的演員,亦是深刻體察制度縫隙的當代女性,此文所看見的不僅僅是崩壞前夕的最後發聲,更是女人被迫置於冷酷的制度之下,步步陷入無以言說的困境。
Thumbnail
若說易卜生的《玩偶之家》為 19 世紀的女性,開啟了一扇離家的窄門,那麼《海妲.蓋柏樂》展現的便是門後的窒息世界。本篇文章由劇場演員 Amily 執筆,同為熟稔文本的演員,亦是深刻體察制度縫隙的當代女性,此文所看見的不僅僅是崩壞前夕的最後發聲,更是女人被迫置於冷酷的制度之下,步步陷入無以言說的困境。
Thumbnail
本文深度解析賽勒布倫尼科夫的舞臺作品《傳奇:帕拉贊諾夫的十段殘篇》,如何以十段殘篇,結合帕拉贊諾夫的電影美學、象徵意象與當代政治流亡抗爭,探討藝術在儀式消失的現代社會如何承接意義,並展現不羈的自由靈魂。
Thumbnail
本文深度解析賽勒布倫尼科夫的舞臺作品《傳奇:帕拉贊諾夫的十段殘篇》,如何以十段殘篇,結合帕拉贊諾夫的電影美學、象徵意象與當代政治流亡抗爭,探討藝術在儀式消失的現代社會如何承接意義,並展現不羈的自由靈魂。
Thumbnail
前言 讀了許多理論,是時候實際動手做做看了,以下是我的模型訓練初體驗,有點糟就是了XD。 正文 def conv(filters, kernel_size, strides=1): return Conv2D(filters, kernel_size,
Thumbnail
前言 讀了許多理論,是時候實際動手做做看了,以下是我的模型訓練初體驗,有點糟就是了XD。 正文 def conv(filters, kernel_size, strides=1): return Conv2D(filters, kernel_size,
Thumbnail
全新版本的《三便士歌劇》如何不落入「復刻經典」的巢臼,反而利用華麗的秀場視覺,引導觀眾在晚期資本主義的消費愉悅之中,而能驚覺「批判」本身亦可能被收編——而當絞繩升起,這場關於如何生存的黑色遊戲,又將帶領新時代的我們走向何種後現代的自我解構?
Thumbnail
全新版本的《三便士歌劇》如何不落入「復刻經典」的巢臼,反而利用華麗的秀場視覺,引導觀眾在晚期資本主義的消費愉悅之中,而能驚覺「批判」本身亦可能被收編——而當絞繩升起,這場關於如何生存的黑色遊戲,又將帶領新時代的我們走向何種後現代的自我解構?
Thumbnail
長期以來,西方美學以《維特魯威人》式的幾何比例定義「完美身體」,這種視覺標準無形中成為殖民擴張與種族分類的暴力工具。本文透過分析奈及利亞編舞家庫德斯.奧尼奎庫的舞作《轉轉生》,探討當代非洲舞蹈如何跳脫「標本式」的文化觀看。
Thumbnail
長期以來,西方美學以《維特魯威人》式的幾何比例定義「完美身體」,這種視覺標準無形中成為殖民擴張與種族分類的暴力工具。本文透過分析奈及利亞編舞家庫德斯.奧尼奎庫的舞作《轉轉生》,探討當代非洲舞蹈如何跳脫「標本式」的文化觀看。
Thumbnail
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 延續 AI說書 - 從0開始 - 93 介紹了 The Corpus of Linguistic Acceptability (CoLA),其核心思想為:如果該句子在語
Thumbnail
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 延續 AI說書 - 從0開始 - 93 介紹了 The Corpus of Linguistic Acceptability (CoLA),其核心思想為:如果該句子在語
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News