📚 iPAS AI 應用規劃師(中級):快速重點整理 - 科目三 - L23103 數值優化技術與方法

cici-avatar-img
發佈於AI
更新 發佈閱讀 5 分鐘

🎯 重點一:最佳化問題的「三本柱」

要搞懂模型怎麼訓練,先掌握這三個專有名詞。

  1. 目標函數 (Objective Function) / 損失函數 (Loss Function):
    白話文:衡量「模型預測值」跟「標準答案」差多少的指標。誤差越小越好!
  2. 決策變數 (Decision Variables):
    白話文:模型裡可以被調整的參數。在神經網路裡,就是常聽到的權重 (Weights)偏差值 (Biases)
  3. 可行域 (Feasible Region):
    白話文:參數可以合法走動的範圍。實務上為了避免模型太複雜,常會加上正規化(例如:L1 正規化會限制參數為 0 以產生稀疏性),這就是在限制可行域。

⚖️ 重點二:損失函數怎麼挑?

原則:任務類型決定損失函數

📌 迴歸任務 (預測連續數值,如房價)

  • 均方誤差 (MSE):對「極端值 / 大誤差」非常敏感,會放大懲罰。
  • 平均絕對誤差 (MAE):對離群值 (Outliers) 較不敏感,有抗雜訊能力,非常穩健。
  • Huber Loss:MSE 與 MAE 的混血兒,兼具穩健與穩定性。

📌 分類任務 (預測類別,如貓狗辨識)

  • 交叉熵 (Cross-Entropy):衡量「機率分佈」的差異,是分類任務的標配!
  • Focal Loss:專門對付「資料不平衡」與「難以分類的樣本」。

🚀 重點三:優化器演化史

優化器 (Optimizer) 決定了模型更新參數的「方向」與「步伐大小(學習率)」。

1. 基礎打底:資料批次量的選擇

  • GD (梯度下降):一次看完「所有」資料才更新一次參數。方向最準,但算得很慢。
  • SGD (隨機梯度下降):一次只看「一筆」資料就更新。速度極快,但方向更新雜訊大、震盪較明顯。
  • Mini-batch SGD (小批次):每次看「一小批」資料(如 32、64 筆)。目前業界與深度學習的最主流做法,平衡了速度與穩定性。

2. 進階外掛:動量 vs. 自適應

  • 動量法 (Momentum) → 解決「方向」問題:
    概念像物理學的慣性。如果連續幾次都往同一個方向走,就加速;遇到小坑(鞍點)也能靠慣性衝過去。
  • Adagrad → 適合稀疏特徵,但有致命傷:
    根據歷史更新頻率調整學習率。缺點是學習率會逐步下降,有「提早罷工(學習率歸零)」的致命傷。
  • RMSprop ➡️ 解決了 Adagrad 提早罷工的問題:
    引入滑動平均 (Moving Average),只記最近的歷史,解決學習率過早歸零的問題,適合非穩定問題 (如 RNN)。
  • Adam ➡️ 目前最常見的王者:
    簡單來說,Adam = Momentum + RMSprop。同時兼顧了方向的慣性與自適應的學習率,是目前深度學習最常用的優化器。

🛠️ 重點四:訓練不穩定怎麼辦?

  1. 狀況:損失值在谷底瘋狂震盪,無法收斂
    解方:學習率調整 (Learning Rate Scheduling)。
    隨著訓練時間推移,慢慢把學習率調小(就像車子快到站時要踩煞車)。
  2. 狀況:訓練集表現很好,但驗證集 (Validation) 表現越來越差
    解方:提早停止 (Early Stopping)。
    這是標準的「過擬合 (Overfitting)」,驗證集指標不再進步時,請果斷停止訓練。
  3. 狀況:梯度爆炸 (Gradient Exploding),出現 NaN 錯誤
    解方:梯度裁剪 (Gradient Clipping)。
    強制設定梯度的上限,最常運用在 RNN 等深層結構中。
  4. 狀況:各層網路輸入數據分佈不斷飄移,訓練很慢
    解方:批次正規化 (Batch Normalization)。
    在模型內部強制將數據標準化,能大幅加速收斂並提升穩定性。


透過預備 iPAS AI 應用規劃師 (中級) 考試,加強 AI 知識。
※ 內容參考 iPAS 官方學習指引,由 AI 整理產製

留言
avatar-img
喬西的數位跨域日常
0會員
26內容數
AI / 行銷 / 程式 / 設計 / 管理 / 閱讀
2026/05/12
🚀 線性代數 x 機器學習重點 一、 向量與矩陣:資料的「容器」 在機器學習裡,這不只是數字,而是資料的結構。 向量 (Vector):表示一串有方向的數值,可代表單筆資料特徵、模型參數、文字/圖片嵌入向量、梯度 點積 (Dot Product):衡量方向相似度與計算投影大小。 L2 範
Thumbnail
2026/05/12
🚀 線性代數 x 機器學習重點 一、 向量與矩陣:資料的「容器」 在機器學習裡,這不只是數字,而是資料的結構。 向量 (Vector):表示一串有方向的數值,可代表單筆資料特徵、模型參數、文字/圖片嵌入向量、梯度 點積 (Dot Product):衡量方向相似度與計算投影大小。 L2 範
Thumbnail
2026/05/11
🟢 常見機率分佈選型 ● 離散型 (Discrete) 伯努利 (Bernoulli) 二項 (Binomial) 泊松 (Poisson) 說明 一次試驗只有兩種可能結果(成功/失敗) n 次獨立伯努利試驗的成功次數 固定時間/空間內「稀有事件」發生次數,平均率 λ 固定且獨
Thumbnail
2026/05/11
🟢 常見機率分佈選型 ● 離散型 (Discrete) 伯努利 (Bernoulli) 二項 (Binomial) 泊松 (Poisson) 說明 一次試驗只有兩種可能結果(成功/失敗) n 次獨立伯努利試驗的成功次數 固定時間/空間內「稀有事件」發生次數,平均率 λ 固定且獨
Thumbnail
2026/05/10
🎯 資料偏誤三類常見來源 來源偏誤 (Source Bias) →「收不夠、分配不均」 ● 說明:抽樣樣本無法代表母體,代表性不足。 ● 舉例:訓練自駕車,結果只收集了「都市」的數據,到了「鄉下」就不會開了。 內容偏誤 (Content Bias) →「資料本身就有偏見」 ● 說明:反映了人
Thumbnail
2026/05/10
🎯 資料偏誤三類常見來源 來源偏誤 (Source Bias) →「收不夠、分配不均」 ● 說明:抽樣樣本無法代表母體,代表性不足。 ● 舉例:訓練自駕車,結果只收集了「都市」的數據,到了「鄉下」就不會開了。 內容偏誤 (Content Bias) →「資料本身就有偏見」 ● 說明:反映了人
Thumbnail
看更多
你可能也想看
Thumbnail
我發現是自己要用以毒攻毒的方式 再次去經驗大考 震盪出自己深層深層的不安、脆弱、批判、怨恨 所有類似於魔性的狀態 - 出發前我什麼也沒帶 媽媽說,你至少要帶筆吧 阿心說,你至少要帶筆吧 有的 我帶了17年前基測用的2B鉛筆 我帶了當時戴的手
Thumbnail
我發現是自己要用以毒攻毒的方式 再次去經驗大考 震盪出自己深層深層的不安、脆弱、批判、怨恨 所有類似於魔性的狀態 - 出發前我什麼也沒帶 媽媽說,你至少要帶筆吧 阿心說,你至少要帶筆吧 有的 我帶了17年前基測用的2B鉛筆 我帶了當時戴的手
Thumbnail
見諸參與鄧伯宸口述,鄧湘庭於〈那個大霧的時代〉記述父親回憶,鄧伯宸因故遭受牽連,而案件核心的三人,在鄧伯宸記憶裡:「成立了成大共產黨,他們製作了五星徽章,印刷共產黨宣言——刻鋼板的——他們收集中共空飄的傳單,以及中國共產黨中央委員會有關文化大革命決議文的英文打字稿,另外還有手槍子彈十發。」
Thumbnail
見諸參與鄧伯宸口述,鄧湘庭於〈那個大霧的時代〉記述父親回憶,鄧伯宸因故遭受牽連,而案件核心的三人,在鄧伯宸記憶裡:「成立了成大共產黨,他們製作了五星徽章,印刷共產黨宣言——刻鋼板的——他們收集中共空飄的傳單,以及中國共產黨中央委員會有關文化大革命決議文的英文打字稿,另外還有手槍子彈十發。」
Thumbnail
當時間變少之後,看戲反而變得更加重要——這是在成為母親之後,我第一次誠實地面對這一件事:我沒有那麼多的晚上,可以任性地留給自己了。看戲不再只是「今天有沒有空」,而是牽動整個週末的結構,誰應該照顧孩子,我該在什麼時間回到家,隔天還有沒有精神帶小孩⋯⋯於是,我不得不學會一件以前並不擅長的事:挑選。
Thumbnail
當時間變少之後,看戲反而變得更加重要——這是在成為母親之後,我第一次誠實地面對這一件事:我沒有那麼多的晚上,可以任性地留給自己了。看戲不再只是「今天有沒有空」,而是牽動整個週末的結構,誰應該照顧孩子,我該在什麼時間回到家,隔天還有沒有精神帶小孩⋯⋯於是,我不得不學會一件以前並不擅長的事:挑選。
Thumbnail
真的不想長大,如果能像花的生長時間一樣慢慢長大那該有多好? 最近要期中考,我媽媽不懂我的心,給了壓力:考試沒考好,就一個月不用手機。
Thumbnail
真的不想長大,如果能像花的生長時間一樣慢慢長大那該有多好? 最近要期中考,我媽媽不懂我的心,給了壓力:考試沒考好,就一個月不用手機。
Thumbnail
當代名導基里爾.賽勒布倫尼科夫身兼電影、劇場與歌劇導演,其作品流動著強烈的反叛與詩意。在俄烏戰爭爆發後,他持續以創作回應專制體制的壓迫。《傳奇:帕拉贊諾夫的十段殘篇》致敬蘇聯電影大師帕拉贊諾夫。本文作者透過媒介本質的分析,解構賽勒布倫尼科夫如何利用影劇雙棲的特質,在荒謬世道中尋找藝術的「生存之道」。
Thumbnail
當代名導基里爾.賽勒布倫尼科夫身兼電影、劇場與歌劇導演,其作品流動著強烈的反叛與詩意。在俄烏戰爭爆發後,他持續以創作回應專制體制的壓迫。《傳奇:帕拉贊諾夫的十段殘篇》致敬蘇聯電影大師帕拉贊諾夫。本文作者透過媒介本質的分析,解構賽勒布倫尼科夫如何利用影劇雙棲的特質,在荒謬世道中尋找藝術的「生存之道」。
Thumbnail
5 月,方格創作島正式開島。這是一趟 28 天的創作旅程。活動期間,每週都會有新的任務地圖與陪跑計畫,從最簡單的帳號使用、沙龍建立,到帶著你從一句話、一張照片開始,一步一步找到屬於自己的創作節奏。不需要長篇大論,不需要完美的文筆,只需要帶上你今天的日常,就可以出發。征服創作島,抱回靈感與大獎!
Thumbnail
5 月,方格創作島正式開島。這是一趟 28 天的創作旅程。活動期間,每週都會有新的任務地圖與陪跑計畫,從最簡單的帳號使用、沙龍建立,到帶著你從一句話、一張照片開始,一步一步找到屬於自己的創作節奏。不需要長篇大論,不需要完美的文筆,只需要帶上你今天的日常,就可以出發。征服創作島,抱回靈感與大獎!
Thumbnail
耶~我們考完試了,一群學生一同發出同樣的聲響。不過自從升上新的年級之後,就沒那麼快樂、輕鬆了,每天都在趕課,就深怕自己跟不上"每位學生有個職責,就是要複習功課或者寫自修,而老師的職責,是要教好學生" 假如我們寫在多的自修、評量、測驗卷、複習卷,也沒辦法考出自再好的成績,因為出題不會只出這些在平常上課
Thumbnail
耶~我們考完試了,一群學生一同發出同樣的聲響。不過自從升上新的年級之後,就沒那麼快樂、輕鬆了,每天都在趕課,就深怕自己跟不上"每位學生有個職責,就是要複習功課或者寫自修,而老師的職責,是要教好學生" 假如我們寫在多的自修、評量、測驗卷、複習卷,也沒辦法考出自再好的成績,因為出題不會只出這些在平常上課
Thumbnail
考試,是每個人人生中一定都會遇到的檢測,不管是期中考、期末考、國中會考、大學聯考,還是以後要當公務人員的考試,大家一定都想要考個好成績,那要怎麼準備要考試的範圍呢? 有人瘋狂刷題、也有人翻教科書,看完後,再去寫複習卷,每個人都有自己的方式,而我有自己創一個考試歌「加油
Thumbnail
考試,是每個人人生中一定都會遇到的檢測,不管是期中考、期末考、國中會考、大學聯考,還是以後要當公務人員的考試,大家一定都想要考個好成績,那要怎麼準備要考試的範圍呢? 有人瘋狂刷題、也有人翻教科書,看完後,再去寫複習卷,每個人都有自己的方式,而我有自己創一個考試歌「加油
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News