📚 iPAS AI 應用規劃師(中級)：快速重點整理 - 科目三 - L23304 模型調整與優化

發佈於AI

2026/05/09 更新2026/05/08 發佈閱讀 5 分鐘

1. 核心重點與關鍵概念表

核心重點	關鍵概念
超參數調校	學習率（Learning Rate）影響收斂速度與穩定性。批次大小（Batch Size）影響梯度估計噪聲、訓練穩定度與記憶體使用量。
激活函數選擇	ReLU 常用於隱藏層，因為計算快，且可緩解梯度消失。 Sigmoid 常用於二元分類，也可用於多標籤輸出。 Softmax 用於多類別單選，輸出機率總和為 1。 Tanh 常用於需要零中心輸出的情境，輸出範圍為 -1 到 1。
優化器特性	Adam 是常用的自適應學習率優化器。 Adagrad 適合稀疏特徵。 Momentum 通常是指 SGD 加上動量，可加速收斂並減少震盪。
正則化技術	L1 會促進稀疏解，常用於特徵選擇。 L2 會讓權重變小但通常不會變成 0，有助模型穩定與降低過擬合。
資料不平衡處理	過採樣（Oversampling）增加少數類樣本。欠採樣（Undersampling ）減少多數類樣本。 Class Weight 透過調整損失權重強化少數類的重要性。 SMOTE 屬於過採樣，會合成新樣本。
模型壓縮技術	知識蒸餾是大模型教小模型。量化是把高精度表示改成低精度表示，如 FP32 轉 INT8。剪枝是移除貢獻低的權重或連線。

2. 重要比較

🔹 學習率與批次大小

在模型訓練中，兩個非常重要的調整參數是學習率（LR）與批次大小（BS）。

參數	過高 / 過大	過低 / 過小
學習率	容易震盪、無法收斂，嚴重時可能梯度爆炸。	收斂很慢，可能長時間停在不佳區域或需要很多步才接近較佳解。
批次大小	梯度估計較穩定，但較耗記憶體，且泛化表現有時不如小批次。	噪聲較大、訓練較不穩，但有時較有助於泛化與跳離不佳解。

🔹 激活函數場景

該用哪個函數？記住對應場景。

隱藏層：首選 ReLU，因為計算效率高，且能緩解梯度消失。
輸出層二元分類：Sigmoid，輸出可解讀為 0 到 1 的機率。
輸出層多類別單選：Softmax，所有類別機率加總為 1。
需要對稱輸出：Tanh，輸出範圍為 -1 到 1。

3. 易混淆觀念

🔹 L1 vs. L2 vs. Elastic Net

比較項目	L1 正則化（Lasso）	L2 正則化（Ridge）	Elastic Net
懲罰類型	權重絕對值總和。	權重平方總和。	L1 + L2 的組合。
主要效果	促進稀疏化，會把部分不重要權重直接壓成 0。	讓權重縮小、模型更平滑，但通常不會變成 0。	兼具部分稀疏性與穩定性，稀疏程度通常介於 L1 與 L2 之間。
常見用途	想自動做特徵選擇、簡化模型時。	想降低過擬合、處理共線性、提升穩定性時。	L1 與 L2 折衷，適合相關特徵多、又想兼顧篩選與穩定時使用。

🔹 過採樣 vs 欠採樣

過採樣（Oversampling）：增加少數類樣本，若只是重複複製，可能造成過擬合。→ SMOTE 屬於過採樣方法，透過少數類樣本之間的插值法合成新樣本，而不是單純複製舊樣本。
欠採樣（Undersampling）：減少多數類樣本，缺點是可能丟失原始資訊。

4. 訓練優化策略對照表

策略名稱	核心作用	重點細節	口訣
Dropout	防止過擬合、提升泛化能力。	只在訓練階段啟用；推論／測試階段不啟用，不會再隨機丟棄神經元。	訓練時隨機關閉部分神經元，測試時不啟用。
Early Stopping 早停法	防止過擬合，並減少不必要的訓練時間。	通常監控驗證集表現，例如 validation loss 或 validation accuracy；當連續數個 epoch 不再改善時停止訓練。	看驗證集，沒進步就停。
Mini-batch	在訓練速度、梯度估計品質與記憶體使用之間取得平衡。	Batch Size 需要調校；太大較穩定但耗記憶體，太小噪聲較大但可能有助泛化。	每次使用一小批樣本更新參數，以兼顧效率、穩定性與記憶體使用。
Learning Rate 學習率	控制每次參數更新幅度，影響收斂速度與穩定性。	常見策略包含 Warm-up 與 Decay；Warm-up 可讓初期訓練較穩，Decay 可讓後期更平滑收斂。	前期可暖身，後期要降速。

透過預備 iPAS AI 應用規劃師 (中級) 考試，加強 AI 知識。
※ 內容參考 iPAS 官方學習指引，由 AI 整理產製

含 AI 應用內容

#考試

喬西的數位跨域日常AI

留言

喬西的數位跨域日常

0會員

26內容數

AI / 行銷 / 程式 / 設計 / 管理 / 閱讀

喬西的數位跨域日常的其他內容

2026/05/07

📚 iPAS AI 應用規劃師(中級)：快速重點整理 - 科目三 - L23303 模型訓練、評估與驗證

🟢 重點一：資料分割與訓練策略（穩定度）在模型訓練時，資料的分配與更新方式決定了收斂速度。 1. 三大資料集角色（不可混淆）訓練集 (Training Set)：負責「學習」，調整模型內部參數（Weights）。驗證集 (Validation Set)：負責「挑選」，用來調整超參數（

2026/05/07

📚 iPAS AI 應用規劃師(中級)：快速重點整理 - 科目三 - L23303 模型訓練、評估與驗證

2026/05/06

📚 iPAS AI 應用規劃師(中級)：快速重點整理 - 科目三 - L23302 模型選擇與架構設計

🌟 核心重點一：任務類型與模型配對任務類型目標常見場景推薦模型分類預測離散類別垃圾郵件、疾病診斷、客戶流失決策樹、隨機森林、SVM、神經網路迴歸預測連續數值房價預測、業績估算線性迴歸、隨機森林迴歸、神經網路聚類自動分組 (無標籤) 客戶分群

2026/05/06

📚 iPAS AI 應用規劃師(中級)：快速重點整理 - 科目三 - L23302 模型選擇與架構設計

2026/05/05

📚 iPAS AI 應用規劃師(中級)：快速重點整理 - 科目三 - L23301 數據準備與特徴工程

🌟 核心觀念一：資料清理 (Data Cleaning) ── 模型的地基資料清理是所有特徵工程的第一步，沒有乾淨的資料，就沒有準確的模型。這部分的考點通常落在「如何根據情境選擇處理方式」。缺失值處理 (Missing Values)：刪除法 (Deletion)：只有在缺失比例極低

2026/05/05

📚 iPAS AI 應用規劃師(中級)：快速重點整理 - 科目三 - L23301 數據準備與特徴工程

看更多

你可能也想看

釀電影，啜一口電影的美好。

往霧的更深處去──從《白色說書人》看轉型正義，與白色恐怖影視文本

見諸參與鄧伯宸口述，鄧湘庭於〈那個大霧的時代〉記述父親回憶，鄧伯宸因故遭受牽連，而案件核心的三人，在鄧伯宸記憶裡：「成立了成大共產黨，他們製作了五星徽章，印刷共產黨宣言——刻鋼板的——他們收集中共空飄的傳單，以及中國共產黨中央委員會有關文化大革命決議文的英文打字稿，另外還有手槍子彈十發。」

#釀電影#釀藝評#藝術評論

2026/05/07

釀電影，啜一口電影的美好。

往霧的更深處去──從《白色說書人》看轉型正義，與白色恐怖影視文本

#釀電影#釀藝評#藝術評論

2026/05/07

方格子 vocus 官方沙龍

🏝️ 方格創作島｜【創作地圖組】全攻略：解鎖靈感，再抽精美家電 ദ്ദി(•̀ ᗜ <)

5 月，方格創作島正式開島。這是一趟 28 天的創作旅程。活動期間，每週都會有新的任務地圖與陪跑計畫，從最簡單的帳號使用、沙龍建立，到帶著你從一句話、一張照片開始，一步一步找到屬於自己的創作節奏。不需要長篇大論，不需要完美的文筆，只需要帶上你今天的日常，就可以出發。征服創作島，抱回靈感與大獎！

#創作#vocus#方格創作島

2026/04/23

方格子 vocus 官方沙龍

🏝️ 方格創作島｜【創作地圖組】全攻略：解鎖靈感，再抽精美家電 ദ്ദി(•̀ ᗜ <)

#創作#vocus#方格創作島

2026/04/23

之容的沙龍

考試

耶~我們考完試了，一群學生一同發出同樣的聲響。不過自從升上新的年級之後，就沒那麼快樂、輕鬆了，每天都在趕課，就深怕自己跟不上"每位學生有個職責，就是要複習功課或者寫自修，而老師的職責，是要教好學生" 假如我們寫在多的自修、評量、測驗卷、複習卷，也沒辦法考出自再好的成績，因為出題不會只出這些在平常上課

2021/11/03

之容的沙龍

考試

2021/11/03

釀電影，啜一口電影的美好。

《傳奇：帕拉贊諾夫的十段殘篇》：流動、跨域、變形的「生存之道」

當代名導基里爾．賽勒布倫尼科夫身兼電影、劇場與歌劇導演，其作品流動著強烈的反叛與詩意。在俄烏戰爭爆發後，他持續以創作回應專制體制的壓迫。《傳奇：帕拉贊諾夫的十段殘篇》致敬蘇聯電影大師帕拉贊諾夫。本文作者透過媒介本質的分析，解構賽勒布倫尼科夫如何利用影劇雙棲的特質，在荒謬世道中尋找藝術的「生存之道」。

#釀電影#釀評論#藝術評論

2026/02/28