建議先看完對應教學影片再作答,效果加倍。
第 1 題
某電商平台 Q3 營運報告顯示,平台上 12,000 筆訂單的平均金額為 3,200 元,但客服主管反映多數消費者實際花費遠低於這個數字。資料科學家計算偏度後得到 Skewness = 2.8。若要選出最能代表「多數消費者典型花費」的集中趨勢指標,應使用:
(A) 算術平均,因為它整合了所有訂單金額,最能反映平台整體營收水準
(B) 中位數,因為偏度遠大於零代表資料右偏,算術平均已被少數高額訂單拉高
(C) 眾數,因為它代表出現次數最多的金額區間,比中位數更貼近消費者行為
(D) 幾何平均,因為訂單金額是乘積效應的累積結果,適合處理偏態資料
答案:B
深度導讀解析
正確答案:B
核心技術點:偏態資料的指標選擇
中級理論拆解:偏度 2.8 遠超 0,分佈嚴重右偏,少數高額訂單把算術平均拉高。中位數取排序後中間值,對極端值完全免疫,反映 50% 消費者的真實水準。
選項坑洞掃描:A 算術平均在右偏時高估多數人水準。C 眾數適合類別型資料,連續金額不適用。D 幾何平均用於成長率連乘,非訂單金額。
破題反射字:偏度 > 0 → 右偏用中位數 / 算術平均 → 被極端值拉高
第 2 題
製造業 AI 品管團隊比較兩條產線的零件重量穩定性。A 產線平均重量 500g、標準差 50g;B 產線平均重量 120g、標準差 18g。新進工程師直接以「A 產線標準差較大」判定 A 產線品質較差。品管主管認為此判斷有誤,最正確的理由是:
(A) 標準差只反映絕對波動,應改用全距比較兩條產線的最大偏離幅度
(B) 兩條產線規格量級不同,應使用 IQR 取代標準差以排除極端值影響
(C) A 產線的樣本量可能較大,標準差自然偏高,需先做 F 檢定比較變異數
(D) 應使用變異係數(CV = 標準差 / 平均數)消除量綱差異後再比較,A 產線 CV = 10% 而 B 產線 CV = 15%,B 產線相對離散度反而更高
答案:D
深度導讀解析
正確答案:D
核心技術點:變異係數與跨量級比較
中級理論拆解:量綱不同時標準差不能直接比。CV 將標準差除以平均數,轉為無因次比例。A 產線 50/500 = 10%,B 產線 18/120 = 15%,B 的相對離散度更高。
選項坑洞掃描:A 全距只看最大最小值,更容易被單一離群值干擾。B IQR 不解決量綱差異問題。C 標準差與樣本量無直接正比關係。
破題反射字:量綱不同 → 變異係數 CV / CV = σ / μ → 無因次比較
第 3 題
某金融科技公司建構信用評分模型,資料科學家在特徵工程階段發現「年收入」欄位偏度 = 3.2、峰度(Pearson 定義)= 8.5。若直接將原始資料餵入線性迴歸模型,最可能造成的問題及對應處理方式為:
(A) 損失函數被少數高收入極端值主導導致梯度不穩定,應先做 log 轉換壓平右尾再建模
(B) 模型會因資料量不足而欠擬合,應增加樣本量至少達到中央極限定理要求的 30 筆以上
(C) 峰度過高代表資料集中度不夠,應對年收入做 Min-Max 標準化將值域壓縮至 0 到 1
(D) 偏度和峰度只影響視覺化呈現,對線性迴歸的係數估計和殘差分佈沒有實質影響
答案:A
深度導讀解析
正確答案:A
核心技術點:偏態特徵的前處理
中級理論拆解:偏度 3.2 嚴重右偏,少數極端值讓損失函數的梯度被放大,收斂不穩定。log 轉換對大數字壓縮力強,能讓右偏分佈趨近對稱,穩定梯度下降。
選項坑洞掃描:B 中央極限定理管均值抽樣分佈,不解決原始資料偏態。C Min-Max 不改變偏態結構,只改範圍。D 偏態直接影響殘差分佈和係數可靠性。
破題反射字:偏度 > 2 → log 轉換 / 峰度 > 3 → 厚尾風險
第 4 題
某零售集團的資料分析師使用箱形圖(Box Plot)檢視全台 200 間門市的月營業額。圖中顯示 Q1 = 80 萬、Q3 = 160 萬,且在上方出現數個離群值標記點。分析師要向主管解釋離群值的判定邏輯,下列敘述何者正確?
(A) 離群值是指超過平均值加減 2 個標準差的資料點,與四分位數無關
(B) IQR = Q3 - Q1 = 80 萬,超過 Q3 + 3 × IQR = 400 萬的門市才會被標記為離群值
(C) IQR = Q3 - Q1 = 80 萬,超過 Q3 + 1.5 × IQR = 280 萬的門市會被標記為離群值
(D) 箱形圖的離群值判定依據是資料是否落在中位數加減一個 IQR 的範圍之外
答案:C
深度導讀解析
正確答案:C
核心技術點:箱形圖離群值規則
中級理論拆解:箱形圖的上鬚界限 = Q3 + 1.5 × IQR。本題 IQR = 160 - 80 = 80 萬,上界 = 160 + 1.5 × 80 = 280 萬,超過此值的門市被標記為離群值。
選項坑洞掃描:A 那是 Z-Score 判定法,不是箱形圖邏輯。B 倍數 3 錯了,標準是 1.5。D 基準是 Q1 和 Q3,不是中位數。
破題反射字:箱形圖離群值 → Q3 + 1.5 × IQR / IQR = Q3 - Q1
第 5 題
某 AI 新創公司的投資人收到年度報告,報告中列出三年的使用者成長率分別為 +80%、-40%、+60%,並宣稱「三年平均成長率 33.3%」。投資人的財務顧問認為這個數字嚴重失真,重新計算後得出的實際年化成長率最接近:
(A) 約 25%,使用中位數取三年中間值排除負成長的影響
(B) 約 20%,使用幾何平均反映成長率的連乘累積效應
(C) 約 20%,使用加權算術平均對負成長年度給予較高權重
(D) 約 28%,使用調和平均處理成長率這類比率型資料
答案:B
深度導讀解析
正確答案:B
核心技術點:幾何平均與年化成長率
中級理論拆解:本金變化 1.8 × 0.6 × 1.6 = 1.728,年化 = 1.728^(1/3) - 1 ≈ 20%... 修正:實際計算 1.728^(1/3) ≈ 1.20,年化約 20%。但幾何平均 ≈ 20% 遠低於算術平均 33.3%,連乘效應讓虧損年大幅拖低真實成長。
選項坑洞掃描:A 中位數 60% 是單年值非年化。C 加權平均仍是加法邏輯,無法處理連乘。D 調和平均用於速率/F1,不用於成長率。
破題反射字:CAGR → 幾何平均 / 算術平均 → 高估成長率
還在用零散筆記備考?
這份《iPAS 中級白話備考筆記》把三科考綱重點全部用人話整理好,考點速記、實戰場景、常見陷阱一次收錄。適合非本科、時間有限、想快速抓住考試方向的自學者。
👉 立即取得備考筆記




















