🌟 隱私風險三分類
- 直接識別 (PII): 看到就知道是誰(身分證字號、姓名、Email)。
- 間接識別 (Quasi-identifier): 單看不知道,但「拼湊」後會現形(出生年月日 + 性別 + 郵遞區號)。
- 再識別 (Re-identification): 透過外部資料(社群、公開資料)將匿名資料重新對回個人身分的行為。
📋 PIA 隱私影響評估
五步驟好記憶口訣:「盤、辨、影、策、責」。
- 盤(資料盤點):釐清資料流向。
- 辨(風險辨識):找出風險點,哪裡會漏個資。
- 影(影響分析):評估衝擊程度,一旦出事,對公司與個人的衝擊。
- 策(策略擬定):提出防範措施,決定要遮蔽、雜湊還是泛化。
- 責(責任分工):界定權責,誰負責管,誰負責審。
風險等級 = 發生機率 × 影響程度
● 低風險: 接受與監控。
● 中風險: 規劃對策。
● 高風險: 優先處理或「迴避」。
🛠️ 常見基礎匿名化技術對照表
遮蔽 | 雜湊 | 泛化 | 隨機擾動 | 分桶 | |
Masking | Hashing | Generalization | Noise | Bucketing | |
主要目的 | 隱藏敏感資訊,避免直接暴露 | 將資料轉為固定長度雜湊值,用於密碼儲存與完整性驗證,通常不可逆 | 降低個人識別度,保留群體資訊 | 保護隱私,同時保留統計趨勢 | 將連續或細節資料分組成區間,降低識別風險 |
具體做法 | 王小明 → 王0明;A123456789 → A12****89 | password123 → SHA-256 雜湊值(建議搭配 Salt) | 台北市大安區 → 台北市 → 北部 | 薪資 50000 → 50123(加入小幅隨機誤差) | 32歲 → 30~39歲 |
特色 | 易讀、保留格式,適合介面顯示與操作畫面 | 不可逆、固定長度輸出,適合安全驗證 | 保留統計分析價值,降低再識別風險 | 保留整體分布,常用於差分隱私 | 簡化資料分布,兼顧隱私與分析效率 |
缺點限制 | 若保留過多仍可能被推測 | 未加鹽 (Salt)容易遭彩虹表攻擊 | 資料細節下降,影響分析精度 | 擾動過大會造成數據失真 | 分桶過粗會降低資料精確度;過細仍可能被識別 |
應用場景 | 客服系統、銀行帳號顯示、醫療資訊部分揭露 | 密碼儲存、數位簽章、檔案完整性驗證、區塊鏈 | 開放資料、醫療研究、政府統計資料共享 | 問卷分析、統計研究、機器學習資料前處理、差分隱私機制 | 可用於商業分析、客戶分群、風險分級及資料去識別化處理 |
※ 加鹽 (Salt):在密碼雜湊前加入一段隨機字串,讓相同密碼產生不同結果,以防止彩虹表破解。
※ 彩虹表:預先計算大量密碼與其雜湊值對照表,用於快速比對並破解密碼。
🛡️ 進階隱私強化 (PETs)
1. K-匿名 vs. L-多樣性 vs. T-接近性
K-匿名 | L-多樣性 | T-接近性 | |
(K-Anonymity) | (L-Diversity) | (T-Closeness) | |
名詞解釋 | 每筆資料至少和其他 K-1 人看起來一樣 | 同一群人中的敏感資料要有不同種類 | 每群資料的敏感資訊比例要接近整體資料 |
主要用途 | 防止辨識出個人身分 | 防止猜出個人隱私內容 | 防止用統計方式推測隱私 |
解決問題 | 避免透過年齡、性別、地區找到某人 | 避免同群組的人敏感資料都相同 | 避免某群組特徵過於明顯 |
簡易範例 | 至少 5 人都屬於「20~30歲、台北、男」 | 某組 5 人病歷不能全是糖尿病 | 全體糖尿病 20%,某組比例也應接近 20% |
關鍵概念 | 至少 K 人相同 | 至少 L 種不同敏感值 | 分布差異不能太大 |
快速記憶 | 看不出你是誰 | 猜不到你的秘密 | 推不出你的機率 |
2. 聯邦學習 (FL) vs. 同態加密 (HE)
聯邦學習(FL) | 同態加密(HE) | |
技術本質 | 分散式機器學習架構 | 密碼學數學協議 |
數據位置 | 數據留在原地(本地端) | 數據加密後可外包給第三方 |
交換內容 | 模型參數(權重/梯度) | 加密後的資料(密文) |
效能瓶頸 | 通訊成本較高,頻繁同步會消耗頻寬 | 加密運算負擔沉重,處理效率較低 |
典型場景 | 行動裝置 AI 訓練、跨院所醫療模型合作 | 雲端機密運算、金融與敏感資料分析 |
💊 補充
- 資料最小化 (Data Minimization):是指收集資料的「欄位項目」要越少越好,不是指檔案的大小 (Size)。
- 聯邦學習的安全隱憂:雖然不傳原始數據,但「模型參數」依然可能洩漏原始資料的特徵(參數洩漏攻擊)。
透過預備 iPAS AI 應用規劃師 (中級) 考試,加強 AI 知識。
※ 內容參考 iPAS 官方學習指引,由 AI 整理產製
















