📚 iPAS AI 應用規劃師(中級):快速重點整理 - 科目三 - L23402 演算法偏見與公平性

cici-avatar-img
發佈於AI
更新 發佈閱讀 6 分鐘

🎯 資料偏誤三類常見來源

  • 來源偏誤 (Source Bias) →「收不夠、分配不均」

說明:抽樣樣本無法代表母體,代表性不足。
舉例:訓練自駕車,結果只收集了「都市」的數據,到了「鄉下」就不會開了。

  • 內容偏誤 (Content Bias) →「資料本身就有偏見」

說明:反映了人類社會現有的刻板印象或系統性歧視。
舉例:如果資料庫裡,主管都是男性、護理師都是女性,模型直接「學偏」。

  • 製程偏誤 (Process Bias) →「標註過程有偏差」

說明:人工標註過程帶入的主觀判斷,標準不一致。
舉例:不同標註員對同一句話的「情緒正負面」標準不一。

🎯 去偏三大技術

  • 前處理 (Pre-processing) = 訓練前

做什麼:從「源頭」把資料洗乾淨。
關鍵字:重抽樣、重新加權、特徵修正、資料平衡化。

  • 內部處理 (In-processing) = 訓練中

做什麼:改變演算法的學習方式,逼它公平。
關鍵字:公平性約束、對抗式去偏 (Adversarial)、調整損失函數 (Loss)。

  • 後處理 (Post-processing) = 訓練後

做什麼:模型已經練好,我們直接「微調輸出的結果」。
關鍵字:閾值調整 (Threshold)、結果校準 (Calibration)。

💡【補充區:兩大公平性評估工具比較】


IBM AIF360

Microsoft Fairlearn

快速記憶

功能完整,適合深入分析

容易導入,適合企業實務

主要功能

評估完整,提供前/中/後處理去偏方法

公平性評估強,並提供再訓練與閾值調整等去偏方法

sklearn 整合

普通

優點

指標多、方法完整

易上手、導入快

限制

較複雜、整合成本高

去偏方法較少

適合情境

研究、高風險治理

一般企業專案

關鍵字

完整型、三階段去偏

實務型、整合方便

🎯 易混淆名詞

🥊 PART 1:公平性指標怎麼選?

1. 群體平等率 (Demographic Parity) =【結果均等的「齊頭式平等」】

說明:不管實力如何,A 族群跟 B 族群拿到「正向結果比例」(例如錄取率)相同或接近,不直接考慮真實資格差異。
缺點:為了湊滿各族群的人數比例,很容易犧牲模型準確性,導致選到不適任的人。

2. 機會平等 (Equal Opportunity) =【只看真材實料的「實力平等」】

說明:在「真的有實力/有資格」的人當中,各群體被選上的機率要一樣。確保優秀的人,絕對不會因為群體身分被刷掉。
關鍵字:關注 True Positive Rate (TPR,真陽性率) 相等。

3. 均衡機率 (Equalized Odds) =【連「看錯」的機率都要公平】

說明:「機會平等」的嚴格升級版!不但「有實力的人」被選中的機率要一樣,連「沒有實力的人」被模型誤判選上的機率,兩個族群也要一樣。
關鍵字:同時要求 TPR (真陽性率) 與 FPR (偽陽性率) 兩者都要相等。

4. 不利影響比 (Disparate Impact) =【80% 法則】

說明:實務上常作初步合規檢查。
公式:不利影響比(DI)=較低群體選取率 ÷ 較高群體選取率;若比值 < 0.8,代表可能有差別影響風險。
計算題練習:
→ 題目:如果問「男性錄取率 10%,女性錄取率 7%」,請問有沒有違反?
→ 計算:7% ÷ 10% = 70%。因為 70% 小於 80%,因此可能存在差別影響風險,需進一步審查。
常見情境:例如招募 AI、貸款審核、學校錄取、人臉辨識等,都常被拿來檢查是否對弱勢族群不利。

🥊 PART 2:後處理的兩種方法

  • 閾值調整 (Threshold):直接改「及格線(判定標準)」

概念:「及格線」配合不同人而移動。
舉例:A 組考卷較簡單 60 分及格,B 組考卷較難,為了降低不公平,改成 55 分及格。

  • 結果校準 (Calibration):及格線不動,讓模型分數對應真實機率(機率校準)

概念:「分數」 被修正回正確的意義。
舉例:統一及格線為 60 分(不動)。B 組考卷較難,考 55 分的學生實際上具備較高的實力(其「原始分數」的含金量被低估)。為了公平,我們將 B 組考 55 分的學生分數「校準(加權)」為 60 分。

💣 常見誤解與陷阱

  • 誤解一:移除敏感特徵(如性別、種族)就能消除偏見?

→ 模型會從 代理變數 (Proxy Variables) 偷學。例如刪了種族,模型會從「郵遞區號」推算出種族,偏見依然存在!

  • 誤解二:公平性與模型準確度可以兼得?

→ 實務上兩者常存在 Trade-off (權衡),但非必然衝突。為了達成公平性約束,往往需要犧牲一部分的整體預測準確率。

  • 誤解三:只要用真實發生的歷史數據來訓練,就不會有偏見

→ 歷史數據常包含人類社會的系統性歧視(內容偏誤),直接餵給模型只會「自動化並放大」這些歧視。

  • 誤解四:AI 公平性純粹是「技術問題」

→ AI 公平性不只是技術問題,缺少跨部門委員會、第三方獨立驗證與 KPI/ESG 結合,技術去偏只是治標不治本。


透過預備 iPAS AI 應用規劃師 (中級) 考試,加強 AI 知識。
※ 內容參考 iPAS 官方學習指引,由 AI 整理產製

留言
avatar-img
喬西的數位跨域日常
0會員
26內容數
AI / 行銷 / 程式 / 設計 / 管理 / 閱讀
2026/05/09
🌟 隱私風險三分類 直接識別 (PII): 看到就知道是誰(身分證字號、姓名、Email)。 間接識別 (Quasi-identifier): 單看不知道,但「拼湊」後會現形(出生年月日 + 性別 + 郵遞區號)。 再識別 (Re-identification): 透過外部資料(社群、公開資
Thumbnail
2026/05/09
🌟 隱私風險三分類 直接識別 (PII): 看到就知道是誰(身分證字號、姓名、Email)。 間接識別 (Quasi-identifier): 單看不知道,但「拼湊」後會現形(出生年月日 + 性別 + 郵遞區號)。 再識別 (Re-identification): 透過外部資料(社群、公開資
Thumbnail
2026/05/08
1. 核心重點與關鍵概念表 核心重點 關鍵概念 超參數調校 學習率(Learning Rate)影響收斂速度與穩定性。 批次大小(Batch Size)影響梯度估計噪聲、訓練穩定度與記憶體使用量。 激活函數選擇 ReLU 常用於隱藏層,因為計算快,且可緩解梯度消失。 Sigmoid 常用
Thumbnail
2026/05/08
1. 核心重點與關鍵概念表 核心重點 關鍵概念 超參數調校 學習率(Learning Rate)影響收斂速度與穩定性。 批次大小(Batch Size)影響梯度估計噪聲、訓練穩定度與記憶體使用量。 激活函數選擇 ReLU 常用於隱藏層,因為計算快,且可緩解梯度消失。 Sigmoid 常用
Thumbnail
2026/05/07
🟢 重點一:資料分割與訓練策略(穩定度) 在模型訓練時,資料的分配與更新方式決定了收斂速度。 1. 三大資料集角色(不可混淆) 訓練集 (Training Set):負責「學習」,調整模型內部參數(Weights)。 驗證集 (Validation Set):負責「挑選」,用來調整超參數(
Thumbnail
2026/05/07
🟢 重點一:資料分割與訓練策略(穩定度) 在模型訓練時,資料的分配與更新方式決定了收斂速度。 1. 三大資料集角色(不可混淆) 訓練集 (Training Set):負責「學習」,調整模型內部參數(Weights)。 驗證集 (Validation Set):負責「挑選」,用來調整超參數(
Thumbnail
看更多
你可能也想看
Thumbnail
我發現是自己要用以毒攻毒的方式 再次去經驗大考 震盪出自己深層深層的不安、脆弱、批判、怨恨 所有類似於魔性的狀態 - 出發前我什麼也沒帶 媽媽說,你至少要帶筆吧 阿心說,你至少要帶筆吧 有的 我帶了17年前基測用的2B鉛筆 我帶了當時戴的手
Thumbnail
我發現是自己要用以毒攻毒的方式 再次去經驗大考 震盪出自己深層深層的不安、脆弱、批判、怨恨 所有類似於魔性的狀態 - 出發前我什麼也沒帶 媽媽說,你至少要帶筆吧 阿心說,你至少要帶筆吧 有的 我帶了17年前基測用的2B鉛筆 我帶了當時戴的手
Thumbnail
耶~我們考完試了,一群學生一同發出同樣的聲響。不過自從升上新的年級之後,就沒那麼快樂、輕鬆了,每天都在趕課,就深怕自己跟不上"每位學生有個職責,就是要複習功課或者寫自修,而老師的職責,是要教好學生" 假如我們寫在多的自修、評量、測驗卷、複習卷,也沒辦法考出自再好的成績,因為出題不會只出這些在平常上課
Thumbnail
耶~我們考完試了,一群學生一同發出同樣的聲響。不過自從升上新的年級之後,就沒那麼快樂、輕鬆了,每天都在趕課,就深怕自己跟不上"每位學生有個職責,就是要複習功課或者寫自修,而老師的職責,是要教好學生" 假如我們寫在多的自修、評量、測驗卷、複習卷,也沒辦法考出自再好的成績,因為出題不會只出這些在平常上課
Thumbnail
當時間變少之後,看戲反而變得更加重要——這是在成為母親之後,我第一次誠實地面對這一件事:我沒有那麼多的晚上,可以任性地留給自己了。看戲不再只是「今天有沒有空」,而是牽動整個週末的結構,誰應該照顧孩子,我該在什麼時間回到家,隔天還有沒有精神帶小孩⋯⋯於是,我不得不學會一件以前並不擅長的事:挑選。
Thumbnail
當時間變少之後,看戲反而變得更加重要——這是在成為母親之後,我第一次誠實地面對這一件事:我沒有那麼多的晚上,可以任性地留給自己了。看戲不再只是「今天有沒有空」,而是牽動整個週末的結構,誰應該照顧孩子,我該在什麼時間回到家,隔天還有沒有精神帶小孩⋯⋯於是,我不得不學會一件以前並不擅長的事:挑選。
Thumbnail
見諸參與鄧伯宸口述,鄧湘庭於〈那個大霧的時代〉記述父親回憶,鄧伯宸因故遭受牽連,而案件核心的三人,在鄧伯宸記憶裡:「成立了成大共產黨,他們製作了五星徽章,印刷共產黨宣言——刻鋼板的——他們收集中共空飄的傳單,以及中國共產黨中央委員會有關文化大革命決議文的英文打字稿,另外還有手槍子彈十發。」
Thumbnail
見諸參與鄧伯宸口述,鄧湘庭於〈那個大霧的時代〉記述父親回憶,鄧伯宸因故遭受牽連,而案件核心的三人,在鄧伯宸記憶裡:「成立了成大共產黨,他們製作了五星徽章,印刷共產黨宣言——刻鋼板的——他們收集中共空飄的傳單,以及中國共產黨中央委員會有關文化大革命決議文的英文打字稿,另外還有手槍子彈十發。」
Thumbnail
5 月,方格創作島正式開島。這是一趟 28 天的創作旅程。活動期間,每週都會有新的任務地圖與陪跑計畫,從最簡單的帳號使用、沙龍建立,到帶著你從一句話、一張照片開始,一步一步找到屬於自己的創作節奏。不需要長篇大論,不需要完美的文筆,只需要帶上你今天的日常,就可以出發。征服創作島,抱回靈感與大獎!
Thumbnail
5 月,方格創作島正式開島。這是一趟 28 天的創作旅程。活動期間,每週都會有新的任務地圖與陪跑計畫,從最簡單的帳號使用、沙龍建立,到帶著你從一句話、一張照片開始,一步一步找到屬於自己的創作節奏。不需要長篇大論,不需要完美的文筆,只需要帶上你今天的日常,就可以出發。征服創作島,抱回靈感與大獎!
Thumbnail
真的不想長大,如果能像花的生長時間一樣慢慢長大那該有多好? 最近要期中考,我媽媽不懂我的心,給了壓力:考試沒考好,就一個月不用手機。
Thumbnail
真的不想長大,如果能像花的生長時間一樣慢慢長大那該有多好? 最近要期中考,我媽媽不懂我的心,給了壓力:考試沒考好,就一個月不用手機。
Thumbnail
考試,是每個人人生中一定都會遇到的檢測,不管是期中考、期末考、國中會考、大學聯考,還是以後要當公務人員的考試,大家一定都想要考個好成績,那要怎麼準備要考試的範圍呢? 有人瘋狂刷題、也有人翻教科書,看完後,再去寫複習卷,每個人都有自己的方式,而我有自己創一個考試歌「加油
Thumbnail
考試,是每個人人生中一定都會遇到的檢測,不管是期中考、期末考、國中會考、大學聯考,還是以後要當公務人員的考試,大家一定都想要考個好成績,那要怎麼準備要考試的範圍呢? 有人瘋狂刷題、也有人翻教科書,看完後,再去寫複習卷,每個人都有自己的方式,而我有自己創一個考試歌「加油
Thumbnail
當代名導基里爾.賽勒布倫尼科夫身兼電影、劇場與歌劇導演,其作品流動著強烈的反叛與詩意。在俄烏戰爭爆發後,他持續以創作回應專制體制的壓迫。《傳奇:帕拉贊諾夫的十段殘篇》致敬蘇聯電影大師帕拉贊諾夫。本文作者透過媒介本質的分析,解構賽勒布倫尼科夫如何利用影劇雙棲的特質,在荒謬世道中尋找藝術的「生存之道」。
Thumbnail
當代名導基里爾.賽勒布倫尼科夫身兼電影、劇場與歌劇導演,其作品流動著強烈的反叛與詩意。在俄烏戰爭爆發後,他持續以創作回應專制體制的壓迫。《傳奇:帕拉贊諾夫的十段殘篇》致敬蘇聯電影大師帕拉贊諾夫。本文作者透過媒介本質的分析,解構賽勒布倫尼科夫如何利用影劇雙棲的特質,在荒謬世道中尋找藝術的「生存之道」。
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News