🏆深度觀念與實務細節

iPAS 中級 AI 考點衝刺測驗：CRISP-DM、ETL、特徵縮放與 Pandas_02

chen chen

發佈於夜鷹計畫

2026/04/18 更新2026/04/18 發佈閱讀 10 分鐘

🏆深度觀念與實務細節

第 1 題：在 CRISP-DM 流程中，確認模型是否達到「專案最初設定的商業成功指標（KPI）」是在哪一個階段進行？

A) 資料理解 (Data Understanding)

B) 建立模型 (Modeling)

C) 評估 (Evaluation)

D) 部署 (Deployment)

正確解答：C

教練解析：在端上桌（部署）前，必須先評估模型能不能解決商業問題。就像新菜研發後要請主管試吃，看符不符合客人期待。

第 2 題：決定要使用「隨機森林 (Random Forest)」還是「支援向量機 (SVM)」來進行分類預測，屬於 CRISP-DM 的哪一個階段？

A) 建立模型 (Modeling)

B) 資料準備 (Data Preparation)

C) 商業理解 (Business Understanding)

D) 評估 (Evaluation)

正確解答：A

教練解析：選擇並執行演算法就是建立模型的核心。這就像選擇要用「煎、煮、炒、炸」哪種烹飪方式。

第 3 題：在 CRISP-DM 的「資料理解 (Data Understanding)」階段，通常會進行下列哪一項工作？

A) 清洗資料並補齊所有的缺失值

B) 收集初步資料並進行探索性資料分析 (EDA) 以檢查資料品質

C) 定義專案的投資報酬率 (ROI)

D) 將模型打包成 API 供前端呼叫

正確解答：B

教練解析：這個階段重點是「看」資料長什麼樣（EDA），還沒開始動刀修改（洗菜）。

第 4 題：CRISP-DM 第一步「商業理解 (Business Understanding)」的最終產出文件通常是什麼？

A) 特徵工程說明書

B) 乾淨且格式統一的資料集 (Data Set)

C) 訓練好的機器學習模型檔案 (.pkl)

D) 專案計畫書與衡量成功的商業指標 (KPI)

正確解答：D

教練解析：第一步就是要白紙黑字寫下目標，確認「怎樣才算成功」。

第 5 題：若在「資料準備」階段發現資料欄位無法滿足需求（如預測房價卻只有顏色資料），最合理的下一步是什麼？

A) 硬著頭皮建立模型

B) 直接進入部署階段

C) 退回「資料理解」或「商業理解」階段，重新評估目標或來源

D) 把顏色做 One-Hot Encoding

正確解答：C

教練解析：巧婦難為無米之炊。食材不對就要回頭找菜，或跟老闆協商降低目標。

第 6 題：在 ETL 流程中，將日期格式從「2026/04/18」統一轉換為「2026-04-18」，屬於哪一階段？

A) Extract (萃取)

B) Transform (轉換)

C) Load (載入)

D) Transfer (傳輸)

正確解答：B

教練解析：改變資料的「樣貌」或「格式」，對應的是 Transform。

第 7 題：關於 ETL 的「Load (載入)」，下列敘述何者最準確？

A) 將清洗後的資料寫入目標端（如：資料倉儲或資料湖）。

B) 將資料載入機器學習模型中訓練。

C) 從外部 API 載入原始資料。

D) 將缺失值載入為平均數。

正確解答：A

教練解析： L 的終點是儲存系統。把食材放進大冰箱儲存就是 Load。

第 8 題：現代大數據常提的「ELT」架構，與傳統「ETL」的最大差異是什麼？

A) ELT 完全不需要做 Transform。

B) 先將原始資料萃取並「載入 (Load)」到目標資料庫，需要分析時再利用其運算力進行「轉換 (Transform)」。

C) ELT 只能處理結構化資料。

D) ELT 是演算法名稱。

正確解答：B

教練解析： ELT 是「先存再算」，得益於雲端資料庫（如 BigQuery）強大的運算能力。

第 9 題：為了符合 GDPR，將資料庫中的「客戶身分證字號」進行遮蔽 (Masking) 處理，應發生在 ETL 的哪一階段？

A) Extract (萃取)

B) Transform (轉換)

C) Load (載入)

D) Export (匯出)

正確解答：B

教練解析：資料脫敏、遮蔽、加密，都是在「加工轉換」階段完成，確保存進去時已安全。

第 10 題：寫一支爬蟲程式定期從政府 API 下載最新天氣 JSON 資料，屬於 ETL 的哪一個動作？

A) Extract (萃取)

B) Transform (轉換)

C) Load (載入)

D) Evaluation (評估)

正確解答：A

教練解析：從外部系統「獲取」資料，就是萃取。這是去市場買菜的過程。

第 11 題：在使用依賴「梯度下降」的演算法（如類神經網路）時，為何建議先進行特徵縮放？

A) 可以自動補齊缺失值。

B) 可以大幅加快模型收斂的速度。

C) 可以將非線性變線性。

D) 可以降低模型複雜度。

正確解答：B

教練解析：尺度差異太大會導致搜尋最佳解時來回震盪。統一尺度可以「直線衝向谷底」。

第 12 題：資料集中含有極端離群值 (Outliers)，且不希望分佈被嚴重扭曲，應優先考慮哪種縮放方法？

A) Min-Max Scaler (正規化)

B) Standard Scaler (標準化)

C) Robust Scaler (穩健縮放)

D) One-Hot Encoding

正確解答：C

教練解析： Robust Scaler 使用「中位數」與「四分位距」，天生對離群值有免疫力。

第 13 題：為了避免「資料洩漏 (Data Leakage)」，使用 StandardScaler 的正確流程是？

A) 把訓練集與測試集合併後一起進行 fit_transform()。

B) 僅用「訓練集」來計算平均值與標準差 (fit)，再套用 (transform) 到訓練與測試集。

C) 僅對測試集進行縮放。

D) 兩邊用不同的縮放方法。

正確解答：B

教練解析：測試集是「未來的考卷」，你不能拿考卷的答案來調整讀書策略 (fit)。

第 14 題：將一組「向右偏態」資料進行 Z-score 標準化後，其圖形分佈會變成什麼形狀？

A) 變成完美的鐘形常態分佈。

B) 維持原本的向右偏態，只是 X 軸刻度平移縮放。

C) 變成均勻分佈。

D) 變成向左偏態。

正確解答：B

教練解析：這是大陷阱！標準化只是「縮放」，不會改變資料原始的形狀。偏心的人縮小了還是偏心。

第 15 題：MinMaxScaler 運算：最大值 100，最小值 20，原始數值「60」縮放後是多少？

A) 0.6

B) 0.4

C) 0.5

D) 1.0

正確解答：C

教練解析： $(60-20) / (100-20) = 40/80 = 0.5$。剛好在正中間。

第 16 題：Pandas 中同時選取「Age」與「Salary」兩個欄位，正確語法是？

A) df['Age', 'Salary']

B) df[['Age', 'Salary']]

C) df.select('Age', 'Salary')

D) df[Age, Salary]

正確解答：B

教練解析：選多個欄位要用「清單」，所以是「雙層中括號」。

第 17 題：將 DataFrame df 中只要包含空值 (NaN) 就整列刪除，語法為何？

A) df.fillna()

B) df.remove_nulls()

C) df.dropna()

D) df.delete(NaN)

正確解答：C

教練解析： dropna (Drop NA) 代表丟棄空值。

第 18 題：Pandas 將「城市」欄位（如：台北、高雄）轉為 0 與 1 的虛擬變數 (One-Hot)，是哪個函數？

A) pd.to_numeric()

B) pd.get_dummies()

C) df['City'].factorize()

D) pd.one_hot()

正確解答：B

教練解析： get_dummies 是最快速產生「虛擬變數」的方法。

第 19 題：讀取 CSV 後，想檢查每個欄位的「資料型態」（如：int64 或 object），呼叫哪個屬性？

A) df.shape

B) df.head()

C) df.dtypes

D) df.values

正確解答：C

教練解析： dtypes 代表 Data Types。

第 20 題：將兩張結構相同的 DataFrame（一月與二月資料）上下疊加（接在正下方），語法為何？

A) pd.merge(df1, df2)

B) pd.concat([df1, df2], axis=0)

C) df1.join(df2)

D) df1 + df2

正確解答：B

教練解析： concat 代表連接，axis=0 代表沿著列方向（上下）疊加。

含 AI 應用內容

留言

chen chen的沙龍

0會員

4內容數

你好，我是 chen chen！一個正在挑戰「iPAS 中級 AI 應用規劃師」的非本科輪班族。我知道下班後讀書有多累，所以在這裡記錄了我的備考筆記、刷題重點，以及專為零碎時間打造的無痛學習法。如果你也是工作忙碌、想跨領域拿下 AI 證照的戰友，歡迎加入我的夜鷹飛行隊，我們一起把證照拿到手！💪

你可能也想看

CCChen的AI學習分享

iPAS AI應用規劃師初級 11/01第四場考試結果分析CCChen

嗨我是CCChen 2025/11/01 iPAS考試場次今天提早公布成績了提供11/01 第四場 AI初級分析: 📌 一、整體數據重點摘要（依表格解析） 📌 雙科同時到考人數： 4155 人 📌 最終核發證書： 1605 張 📌 總獲證率：38.63%（當次＋跨次）

#CCChen#學習#iPASAI應用規劃師

2025/11/14

CCChen的AI學習分享

iPAS AI應用規劃師初級 11/01第四場考試結果分析CCChen

#CCChen#學習#iPASAI應用規劃師

2025/11/14

CCChen的AI學習分享

iPAS官網公告的AI中級題目-Python題目分析CCChen

嗨我是CCChen 根據11/20 iPAS官網公告的AI中級題目針對科目二+科目三相關Python 題目題組進行分析 AI 中級考試 (L22 + L23) Python 題目分析 (分析工具 NotebookLM pro) AI 中級考試在 Python 題目的設計上，邏輯

#CCChen#學習#iPASAI應用規劃師

2025/11/21

CCChen的AI學習分享

iPAS官網公告的AI中級題目-Python題目分析CCChen

#CCChen#學習#iPASAI應用規劃師

2025/11/21

CCChen的AI學習分享

iPAS AI應用規劃師-初級–合格取證的學習分享~階段二 (了解AI)CCChen

嗨我是CCChen 已參加經濟部iPAS AI應用規劃師-初級評鑑考試預計2025年舉辦4場考試,已執行2場考試, 我都有參加也都合格. 也已報名8/16第三場初級考試目的是持續收集考試題目與題型趨勢順便為11月份第二場AI中級考試暖身與複習基礎知識相關考試成績如下

#分享#學習#iPASAI應用規劃師

2025/06/16

CCChen的AI學習分享

iPAS AI應用規劃師-初級–合格取證的學習分享~階段二 (了解AI)CCChen

#分享#學習#iPASAI應用規劃師

2025/06/16

釀電影，啜一口電影的美好。

吃完飯後再談道德，除魅之後再復魅：巴里．柯斯基與柏林劇團的《三便士歌劇》

全新版本的《三便士歌劇》如何不落入「復刻經典」的巢臼，反而利用華麗的秀場視覺，引導觀眾在晚期資本主義的消費愉悅之中，而能驚覺「批判」本身亦可能被收編——而當絞繩升起，這場關於如何生存的黑色遊戲，又將帶領新時代的我們走向何種後現代的自我解構？

#2026北藝嚴選#BarrieKosky#BerlinerEnsemble

2026/03/10

釀電影，啜一口電影的美好。

吃完飯後再談道德，除魅之後再復魅：巴里．柯斯基與柏林劇團的《三便士歌劇》

#2026北藝嚴選#BarrieKosky#BerlinerEnsemble

2026/03/10

CCChen的AI學習分享

iPAS AI應用規劃師初級-考試倒數 16 天備考指南與建議CCChen

嗨我是CCChen iPAS AI應用規劃師初級 08/16 第三場考試倒數 16 天了！最近收到很多朋友私訊問我：「要怎麼有效準備考試？有沒有學習順序？到底該怎麼開始？」回想我 2~3 月準備第一場AI初級考試時，也是跟你們一樣徬徨無助，因此特別整理這篇文章，分享我當初的學習過程與

#學習#分享#iPASAI應用規劃師

2025/07/31

CCChen的AI學習分享

iPAS AI應用規劃師初級-考試倒數 16 天備考指南與建議CCChen

#學習#分享#iPASAI應用規劃師

2025/07/31

趙鐸的沙龍

《轉轉生 Re:INCARNATION》：釋放差異的身體裂縫

長期以來，西方美學以《維特魯威人》式的幾何比例定義「完美身體」，這種視覺標準無形中成為殖民擴張與種族分類的暴力工具。本文透過分析奈及利亞編舞家庫德斯．奧尼奎庫的舞作《轉轉生》，探討當代非洲舞蹈如何跳脫「標本式」的文化觀看。

#2026北藝嚴選#北藝嚴選#臺北表演藝術中心

2026/02/28

趙鐸的沙龍

《轉轉生 Re:INCARNATION》：釋放差異的身體裂縫

#2026北藝嚴選#北藝嚴選#臺北表演藝術中心

2026/02/28

Amily的沙龍

在理解與拒絕之間：從多重身分觀看《海妲．蓋柏樂》

若說易卜生的《玩偶之家》為 19 世紀的女性，開啟了一扇離家的窄門，那麼《海妲．蓋柏樂》展現的便是門後的窒息世界。本篇文章由劇場演員 Amily 執筆，同為熟稔文本的演員，亦是深刻體察制度縫隙的當代女性，此文所看見的不僅僅是崩壞前夕的最後發聲，更是女人被迫置於冷酷的制度之下，步步陷入無以言說的困境。

#2026北藝嚴選#北藝嚴選#臺北表演藝術中心

2026/02/28