【L233】機器學習建模與參數調校 模擬考題(中級)

更新 發佈閱讀 13 分鐘

第 1 題

某銀行信用評分模型使用「郵遞區號」做 Target Encoding,將類別替換為該區歷史違約率。驗證集 AUC 達 0.88,但上線後降至 0.71。資料科學家檢查後發現,編碼值是在切分交叉驗證前用全訓練資料一次算好。下列修正何者最能對症下藥?

(A) 將郵遞區號由 3 碼改成 6 碼,讓模型取得更細的地理區域差異。

(B) 改用 Label Encoding 把郵遞區號轉成整數,避免平均違約率波動。

(C) 完全移除郵遞區號,改用不含任何類別特徵的模型重新訓練。

(D) 改用 OOF Target Encoding,並對低頻類別加入全域平均平滑。

深度導讀解析

正確答案:D

核心考點:Target Encoding 避免目標洩漏

理論拆解:Target Encoding 若先用全資料計算,會把驗證折的目標資訊倒灌進特徵。OOF 編碼只用其他折計算目前折的編碼,平滑化可降低低頻類別極端值。

選項坑洞掃描:A 會增加低頻類別與過擬合風險。B Label Encoding 引入偽順序。C 可能放棄有效地理訊號。

破題反射字:Target Encoding 洩漏 → OOF / 低頻類別 → 平滑化


第 2 題

某銀行詐欺偵測模型輸出交易風險機率,預設以 0.5 作為分類閾值。上線試算後 Recall 只有 40%,大量詐欺被漏過;但調低閾值又會增加警報量,超出人工審查負荷。風控主管要求兼顧漏報風險與每日案件處理量,並留下可稽核的閾值選擇依據。下列閾值調整策略何者最合適?

(A) 用驗證集曲線比較各閾值,依 Recall 下限與警報量上限選擇。

(B) 固定使用 0.5 閾值,確保所有模型都能用相同標準比較。

(C) 只選 Accuracy 最高的閾值,因為整體正確率最高就代表最適合上線運作。

(D) 只選 ROC-AUC 最高的模型,不需再依警報量與人力限制調整閾值。

深度導讀解析

正確答案:A

核心考點:分類閾值依業務限制選擇

理論拆解:閾值是業務決策點,不是固定技術常數。詐欺偵測需在漏報成本與警報人力間取捨,應在驗證集上比較不同閾值的 Recall、Precision 與警報量。

選項坑洞掃描:B 忽略不平衡資料與任務成本。C Accuracy 會被多數類誤導。D AUC 是排序指標,不能取代上線閾值設定。

破題反射字:詐欺閾值 → PR 曲線 / 業務限制 → Recall 與警報量


第 3 題

某電商推薦模型需調整 learning rate、樹深、subsample、colsample 與正則化等多個超參數。若每個維度都做完整 Grid Search,組合數會快速爆炸,單次訓練又需 10 分鐘,計算預算無法支撐。下列策略何者最合適?

(A) 將每個維度縮到 3 個候選值,仍完整跑完所有 Grid Search 組合。

(B) 放棄超參數調整,直接使用套件預設值,避免任何額外計算成本。

(C) 改用隨機搜尋或貝氏最佳化,以較少試驗探索高潛力組合。

(D) 只調整 learning rate,其餘超參數固定,避免模型搜尋空間過大。

深度導讀解析

正確答案:C

核心考點:高維超參數搜尋策略

理論拆解:高維超參數空間下,Grid Search 成本高且效率差。Random Search 在高維常較有效;Bayesian Optimization 可用過去試驗結果引導下一組參數。

選項坑洞掃描:A 縮小 Grid 仍可能成本過高。B 預設值不一定合適。D 忽略超參數交互作用。

破題反射字:Grid 爆炸 → Random Search / 高成本搜尋 → 貝氏最佳化


第 4 題

某醫學資料團隊有 5,000 筆病患資料,用於預測疾病風險。資料中陽性比例偏低,且部分病患可能有多次就診紀錄。資料科學家要設計交叉驗證,以估計模型泛化能力並避免資料切分造成偏差。院方也要求評估結果可供倫理審查追溯,並避免同一病患資料外洩到驗證折。下列做法何者最合適?

(A) 採 1-Fold,也就是直接用全部訓練資料評估模型表現。

(B) 採 5 或 10 折;不平衡用分層切分,同病患紀錄用群組切分。

(C) 採 1000-Fold,因為 K 越大一定越穩定,計算成本不需考量。

(D) 不做交叉驗證,只用一次 80/20 train/test 切分作為最終泛化估計。

深度導讀解析

正確答案:B

核心考點:K-Fold、Stratified K-Fold 與 Group K-Fold

理論拆解:5 或 10-fold 是常見平衡選擇。類別不平衡時需維持類別比例;同一病患多筆資料時,要避免同病患資料同時進訓練與驗證。

選項坑洞掃描:A 等同用訓練集評估。C K 過大不一定更適合且成本高。D 單次切分估計不穩定,也可能切出偏差。

破題反射字:不平衡 → Stratified / 同病患多筆 → Group


第 5 題

某醫院導入癌症篩檢 AI,同時資訊部門也維護垃圾郵件過濾模型。主管詢問資料科學家,為何兩種分類任務不能只用同一個評估指標。團隊需依漏判與誤判成本選擇指標,並向醫師與資訊主管說明取捨。若指標選錯,可能造成病患漏診或重要郵件被誤刪。下列說明何者最正確?

(A) 癌症篩檢重視 Recall,垃圾郵件過濾重視 Precision。

(B) 兩種任務都應只看 Accuracy,因為整體正確率最高就代表部署風險最低。

(C) 兩種任務都應只看 Recall,因為任何場景中漏掉正類都比誤判更嚴重。

(D) 兩種任務都應只看 Precision,因為任何場景中誤判正類都比漏掉更嚴重。

深度導讀解析

正確答案:A

核心考點:指標選型依錯誤成本決定

理論拆解:評估指標要對應錯誤成本。癌症篩檢漏診成本高,重視 Recall;垃圾郵件誤殺正常信成本高,重視 Precision。

選項坑洞掃描:B Accuracy 在不平衡任務下常誤導。C 與 D 都把單一指標套用到所有場景,忽略業務成本差異。

破題反射字:漏診昂貴 → Recall / 誤殺昂貴 → Precision


第 6 題

某金融團隊比較兩個二元分類模型,模型 A 的 AUC-ROC 為 0.89、模型 B 為 0.76。主管看到模型 B 在某個高 Precision 運作點仍有可用 Recall,想先釐清 AUC 的統計意義,避免只看單一閾值就下結論。資料科學家應如何回答最正確?

(A) AUC 就是 Accuracy 的別名,兩者都表示固定閾值下的整體分類正確率。

(B) AUC 只在正負樣本完全平衡時才有意義,不平衡資料上不能參考。

(C) AUC 是 ROC 曲線下面積,表示模型對正負樣本分數排序的整體能力。

(D) AUC 越低代表模型越優秀,因此應優先選擇接近 0 的模型上線。

深度導讀解析

正確答案:C

核心考點:AUC-ROC 的排序意義

理論拆解:ROC-AUC 衡量所有閾值下的排序能力,可理解為正樣本分數高於負樣本的機率傾向。它不是 Accuracy,也不是固定閾值表現。

選項坑洞掃描:A 混淆 AUC 與 Accuracy。B 誤解 AUC 適用性。D 把 AUC 方向完全顛倒。

破題反射字:ROC 下面積 → 排序能力 / 閾值無關 → AUC


第 7 題

某資深工程師向新進同事說明 Dropout。團隊目前的深度模型在訓練集表現很好,但驗證集表現不穩,懷疑神經元過度共適應。專案要求在不大幅改架構的情況下降低過擬合風險,且需釐清訓練與推論階段的差異。下列對 Dropout 原理與訓練/推論差異的描述何者最正確?

(A) Dropout 會增加大量可訓練參數,因此能直接提升模型容量。

(B) Dropout 只在推論階段啟用,訓練時應關閉以確保模型穩定收斂。

(C) Dropout 會阻斷梯度傳遞,因此實務上應避免用於深度網路。

(D) 訓練隨機丟棄神經元;Inverted Dropout 訓練補償,推論關閉。

深度導讀解析

正確答案:D

核心考點:Dropout 與 Inverted Dropout 機制

理論拆解:Dropout 在訓練時隨機將部分輸出設為 0,降低神經元過度共適應。常見 Inverted Dropout 是訓練時除以保留率補償期望值,推論時直接關閉,不再縮放。

選項坑洞掃描:A Dropout 沒有大量可訓練參數。B 訓練與推論階段顛倒。C Dropout 是常見正則化,不是阻斷所有梯度。

破題反射字:訓練隨機丟棄 → Dropout / 推論關閉 → Inverted Dropout


第 8 題

某深度網路訓練初期 loss 下降緩慢,中期又常震盪。工程師考慮在卷積層或全連接層後加入 Batch Normalization,希望穩定每層輸入尺度,讓訓練對初始化與學習率較不敏感。團隊也希望維持可解釋的訓練設定,方便後續調參紀錄。下列描述何者最正確?

(A) BN 會讓參數量暴增到不可訓練規模,因此多數深度模型應避免使用。

(B) BN 用 batch 統計量標準化中間輸入,再以 γ、β 調整。

(C) BN 主要用來增加過擬合,因此只適合資料量極大的模型。

(D) BN 只能放在輸入層,放在中間層會破壞網路的收斂。


深度導讀解析

正確答案:B

核心考點:Batch Normalization 機制

理論拆解:BN 會用 batch 均值與標準差標準化中間表示,再透過 γ、β 學回合適尺度。它常改善優化穩定性、加速收斂,並有輕度正則效果。

選項坑洞掃描:A γ、β 只增加少量參數。C BN 通常不以增加過擬合為目的。D BN 常放在中間層,而非只限輸入層。

破題反射字:標準化 + γβ → BN / 訓練不穩 → 優化穩定


第 9 題

某團隊訓練影像分類模型,前 30 epoch 快速收斂,但之後 loss 開始震盪,驗證表現也停滯。工程師判斷模型仍有改善空間,想調整學習率排程,使前期能快速探索,後期能穩定精調。產品時程也要求避免重新設計模型架構,只先調整訓練策略。下列策略何者最合適?

(A) 採用學習率衰減策略,讓訓練後期更新幅度更加穩定些。

(B) 全程固定維持最大學習率 0.1,讓模型持續保持快速探索狀態。

(C) 全程固定維持最小學習率 1e-6,確保每一步更新都足夠保守。

(D) 每個 iteration 隨機抽一個學習率,讓隨機性取代訓練排程設計。

深度導讀解析

正確答案:A

核心考點:學習率衰減策略

理論拆解:前期較大學習率有利快速探索,後期衰減可降低震盪並精調。Step Decay、Cosine Annealing、ReduceLROnPlateau 都是常見策略。

選項坑洞掃描:B 後期可能持續震盪。C 前期收斂過慢。D 隨機學習率不能取代有設計的排程。

破題反射字:後期震盪 → 學習率衰減 / 快速探索後 → 小步精調


第 10 題

某新創團隊缺乏資深 ML 工程師,需在兩週內為客戶建立銷售預測基線模型。CTO 考慮導入 AutoML 平台,希望快速比較模型與前處理組合,但仍需向客戶說明模型限制。客戶也要求交付資料切分與評估指標說明。下列對 AutoML 適用邊界的描述何者最正確?

(A) AutoML 導入後可完全取代資料科學家,資料切分與指標選擇也不需人工確認。

(B) AutoML 可快速建立基線,但仍需人工檢查資料、洩漏與指標。

(C) AutoML 一定比人工調參更好,因此高度客製化任務也應完全交給平台處理。

(D) AutoML 只能處理分類任務,迴歸、時間序列與影像任務都不能使用。

深度導讀解析

正確答案:B

核心考點:AutoML 適用邊界

理論拆解:AutoML 適合快速建立 baseline、比較模型與前處理流程,但不是全自動保證正確。資料洩漏、切分方式、評估指標、領域限制仍需人工審查。

選項坑洞掃描:A 過度宣稱 AutoML 萬能。C 絕對化地說一定更好。D 錯把 AutoML 限縮為只支援分類。

破題反射字:快速基線 → AutoML / 資料與指標 → 人工把關

留言
avatar-img
iPAS自學路|iPAS AI 應用規劃師備考筆記
431會員
59內容數
本站整理非本科上班族準備 iPAS AI 應用規劃師初級與中級考試的自學紀錄,包含備考筆記、考點整理、模擬題練習、考後反思與實際準備方法。本人已取得初級與中級 iPAS AI 應用規劃師證照。
2026/05/04
第 1 題 某電商行銷團隊要做客戶分群模型,資料包含「職業類別(教師、工程師、醫護、自雇⋯⋯共 24 類無順序關係)」、「年收入」、「平均消費金額」。資料科學家要把職業類別欄位餵進 XGBoost,思考如何做特徵編碼以兼顧模型效能與可解釋性。下列編碼策略何者最合適? (A) 採 Label En
2026/05/04
第 1 題 某電商行銷團隊要做客戶分群模型,資料包含「職業類別(教師、工程師、醫護、自雇⋯⋯共 24 類無順序關係)」、「年收入」、「平均消費金額」。資料科學家要把職業類別欄位餵進 XGBoost,思考如何做特徵編碼以兼顧模型效能與可解釋性。下列編碼策略何者最合適? (A) 採 Label En
2026/05/01
第 1 題 某廣告點擊預測模型訓練集 AUC 達 0.95、但驗證集 AUC 僅 0.72,且訓練集上預測機率分布極度集中於兩端而驗證集明顯發散。資料科學家要判斷模型狀態並對症下藥。下列何項診斷與處理最為正確? (A) 模型狀態健康,訓練集指標高於驗證集屬正常,無需調整直接上線即可。 (B)
2026/05/01
第 1 題 某廣告點擊預測模型訓練集 AUC 達 0.95、但驗證集 AUC 僅 0.72,且訓練集上預測機率分布極度集中於兩端而驗證集明顯發散。資料科學家要判斷模型狀態並對症下藥。下列何項診斷與處理最為正確? (A) 模型狀態健康,訓練集指標高於驗證集屬正常,無需調整直接上線即可。 (B)
2026/04/30
第 1 題 某醫院導入某疾病快篩,已知該疾病在就診族群中盛行率為 1%,檢驗敏感度(患病時陽性機率)為 95%、特異度(健康時陰性機率)為 95%。一名民眾篩檢結果為陽性,院方想向他說明「真的患病機率」約為多少。下列何項最接近正確答案? (A) 約 95%,因為檢驗敏感度即為患病機率的最佳估計值
2026/04/30
第 1 題 某醫院導入某疾病快篩,已知該疾病在就診族群中盛行率為 1%,檢驗敏感度(患病時陽性機率)為 95%、特異度(健康時陰性機率)為 95%。一名民眾篩檢結果為陽性,院方想向他說明「真的患病機率」約為多少。下列何項最接近正確答案? (A) 約 95%,因為檢驗敏感度即為患病機率的最佳估計值
看更多
你可能也想看
Thumbnail
見諸參與鄧伯宸口述,鄧湘庭於〈那個大霧的時代〉記述父親回憶,鄧伯宸因故遭受牽連,而案件核心的三人,在鄧伯宸記憶裡:「成立了成大共產黨,他們製作了五星徽章,印刷共產黨宣言——刻鋼板的——他們收集中共空飄的傳單,以及中國共產黨中央委員會有關文化大革命決議文的英文打字稿,另外還有手槍子彈十發。」
Thumbnail
見諸參與鄧伯宸口述,鄧湘庭於〈那個大霧的時代〉記述父親回憶,鄧伯宸因故遭受牽連,而案件核心的三人,在鄧伯宸記憶裡:「成立了成大共產黨,他們製作了五星徽章,印刷共產黨宣言——刻鋼板的——他們收集中共空飄的傳單,以及中國共產黨中央委員會有關文化大革命決議文的英文打字稿,另外還有手槍子彈十發。」
Thumbnail
本文分享作者如何運用 AI 作為「專屬備考顧問」,學習 AI 基礎概論。透過四招「說清楚需求」、「抱怨不順」、「懷疑」,以及「重複」,並結合 ChatGPT 付費版「專案」功能或 Gemini 免費版「Gem」功能,有效整理學習資料、避免幹擾,並生成客製化學習路徑與考前「小抄」,大幅提升學習成效。
Thumbnail
本文分享作者如何運用 AI 作為「專屬備考顧問」,學習 AI 基礎概論。透過四招「說清楚需求」、「抱怨不順」、「懷疑」,以及「重複」,並結合 ChatGPT 付費版「專案」功能或 Gemini 免費版「Gem」功能,有效整理學習資料、避免幹擾,並生成客製化學習路徑與考前「小抄」,大幅提升學習成效。
Thumbnail
當時間變少之後,看戲反而變得更加重要——這是在成為母親之後,我第一次誠實地面對這一件事:我沒有那麼多的晚上,可以任性地留給自己了。看戲不再只是「今天有沒有空」,而是牽動整個週末的結構,誰應該照顧孩子,我該在什麼時間回到家,隔天還有沒有精神帶小孩⋯⋯於是,我不得不學會一件以前並不擅長的事:挑選。
Thumbnail
當時間變少之後,看戲反而變得更加重要——這是在成為母親之後,我第一次誠實地面對這一件事:我沒有那麼多的晚上,可以任性地留給自己了。看戲不再只是「今天有沒有空」,而是牽動整個週末的結構,誰應該照顧孩子,我該在什麼時間回到家,隔天還有沒有精神帶小孩⋯⋯於是,我不得不學會一件以前並不擅長的事:挑選。
Thumbnail
分享 iPAS AI 應用規劃師初級證照的準備心得與考試經驗,包含考試科目、準備書籍、讀書方法、答題技巧,以及考後感想。作者強調 iPAS 考試不僅考驗知識,更考驗知識整合、推導與應用的能力。
Thumbnail
分享 iPAS AI 應用規劃師初級證照的準備心得與考試經驗,包含考試科目、準備書籍、讀書方法、答題技巧,以及考後感想。作者強調 iPAS 考試不僅考驗知識,更考驗知識整合、推導與應用的能力。
Thumbnail
這次,我重新走進考場後,心情很複雜 第三屆的錄取率降到45.09%,我感受到題目在變難。所以這次,我特地報名重考,想親身體會學員們面對的挑戰。 但考完第四屆,當我走出考場的那一刻,很多疑問和不安在心中翻攪。我不禁想問: 這還是當初那個「初級」應用規劃師嗎?
Thumbnail
這次,我重新走進考場後,心情很複雜 第三屆的錄取率降到45.09%,我感受到題目在變難。所以這次,我特地報名重考,想親身體會學員們面對的挑戰。 但考完第四屆,當我走出考場的那一刻,很多疑問和不安在心中翻攪。我不禁想問: 這還是當初那個「初級」應用規劃師嗎?
Thumbnail
當代名導基里爾.賽勒布倫尼科夫身兼電影、劇場與歌劇導演,其作品流動著強烈的反叛與詩意。在俄烏戰爭爆發後,他持續以創作回應專制體制的壓迫。《傳奇:帕拉贊諾夫的十段殘篇》致敬蘇聯電影大師帕拉贊諾夫。本文作者透過媒介本質的分析,解構賽勒布倫尼科夫如何利用影劇雙棲的特質,在荒謬世道中尋找藝術的「生存之道」。
Thumbnail
當代名導基里爾.賽勒布倫尼科夫身兼電影、劇場與歌劇導演,其作品流動著強烈的反叛與詩意。在俄烏戰爭爆發後,他持續以創作回應專制體制的壓迫。《傳奇:帕拉贊諾夫的十段殘篇》致敬蘇聯電影大師帕拉贊諾夫。本文作者透過媒介本質的分析,解構賽勒布倫尼科夫如何利用影劇雙棲的特質,在荒謬世道中尋找藝術的「生存之道」。
Thumbnail
在 AI 逐漸成為新標準能力的時代,你要怎麼證明自己的實力?今天我會帶你用最簡單、最清楚的方式,一次看懂經濟部官方推出的 iPAS《AI 應用規劃師》證照。我們會一起認識:為什麼現在需要新的 AI 能力標準?什麼是「產業人才能力鑑定 iPAS」?AI 應用規劃師的角色、工作內容與四大核心職責;初級
Thumbnail
在 AI 逐漸成為新標準能力的時代,你要怎麼證明自己的實力?今天我會帶你用最簡單、最清楚的方式,一次看懂經濟部官方推出的 iPAS《AI 應用規劃師》證照。我們會一起認識:為什麼現在需要新的 AI 能力標準?什麼是「產業人才能力鑑定 iPAS」?AI 應用規劃師的角色、工作內容與四大核心職責;初級
Thumbnail
iPAS AI應用規劃師|初級與中級考試題目難易度|深度分析評論 & 後續備考建議 — CCChen 專業考試評論 — 在 iPAS AI 應用規劃師制度逐步成熟的 2025年,初級與中級的命題方向已愈趨清晰,也更加對應企業實際導入 AI 的需求。 本文依據 114 年第四梯次初級官方公告試
Thumbnail
iPAS AI應用規劃師|初級與中級考試題目難易度|深度分析評論 & 後續備考建議 — CCChen 專業考試評論 — 在 iPAS AI 應用規劃師制度逐步成熟的 2025年,初級與中級的命題方向已愈趨清晰,也更加對應企業實際導入 AI 的需求。 本文依據 114 年第四梯次初級官方公告試
Thumbnail
這篇文章分享準備經濟部iPAS AI應用規劃師證照的經驗。文中介紹了官網的培訓資源,包括學習指引、政府相關培訓資源和數位學習課程,推薦初學者從『製造業AI升級引擎』的實體或線上課程開始學習。實體課程由產業競爭力發展中心提供。線上課程完成測驗後可獲得完訓證書。文章也包含10道AI應用規劃師考題
Thumbnail
這篇文章分享準備經濟部iPAS AI應用規劃師證照的經驗。文中介紹了官網的培訓資源,包括學習指引、政府相關培訓資源和數位學習課程,推薦初學者從『製造業AI升級引擎』的實體或線上課程開始學習。實體課程由產業競爭力發展中心提供。線上課程完成測驗後可獲得完訓證書。文章也包含10道AI應用規劃師考題
Thumbnail
5 月,方格創作島正式開島。這是一趟 28 天的創作旅程。活動期間,每週都會有新的任務地圖與陪跑計畫,從最簡單的帳號使用、沙龍建立,到帶著你從一句話、一張照片開始,一步一步找到屬於自己的創作節奏。不需要長篇大論,不需要完美的文筆,只需要帶上你今天的日常,就可以出發。征服創作島,抱回靈感與大獎!
Thumbnail
5 月,方格創作島正式開島。這是一趟 28 天的創作旅程。活動期間,每週都會有新的任務地圖與陪跑計畫,從最簡單的帳號使用、沙龍建立,到帶著你從一句話、一張照片開始,一步一步找到屬於自己的創作節奏。不需要長篇大論,不需要完美的文筆,只需要帶上你今天的日常,就可以出發。征服創作島,抱回靈感與大獎!
Thumbnail
從來沒想過,自己有一天可以受邀參加這種正式場合的活動。 今天,我來到了 IEAT 會議中心,以「AI 應用規劃師」的身分,參加經濟部 iPAS 產業人才能力鑑定的獲證者專場活動。現場聚集了一些人,全部都是經濟部認證的各行各業菁英唷!
Thumbnail
從來沒想過,自己有一天可以受邀參加這種正式場合的活動。 今天,我來到了 IEAT 會議中心,以「AI 應用規劃師」的身分,參加經濟部 iPAS 產業人才能力鑑定的獲證者專場活動。現場聚集了一些人,全部都是經濟部認證的各行各業菁英唷!
Thumbnail
我其實是個很抗拒考試的人,以前學生時代最討厭硬背,但我很喜歡嘗試各種數位工具。這次我靈機一動,既然要考「AI 應用規劃」,那我為何不應用 AI 來規劃我的整個備考過程呢?以下就是我,如何用 AI 學習新領域、完整備考流程、實戰心法,以及提示詞(Prompt)的操作細節,原汁原味全部公開。
Thumbnail
我其實是個很抗拒考試的人,以前學生時代最討厭硬背,但我很喜歡嘗試各種數位工具。這次我靈機一動,既然要考「AI 應用規劃」,那我為何不應用 AI 來規劃我的整個備考過程呢?以下就是我,如何用 AI 學習新領域、完整備考流程、實戰心法,以及提示詞(Prompt)的操作細節,原汁原味全部公開。
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News