在臨床診斷與機器學習領域,「模型好不好用」一直是大家最關心的問題。無論是評估跌倒風險、癌症篩檢,還是辨識一張 X 光片是否有異常,我們都需要一套客觀、可比較的指標來判斷工具的準確性。
這篇文章將從 臨床篩檢工具 的角度出發,介紹四個核心名詞:TP、FP、FN、TN,接著帶入 AUC 與森林圖 的概念,並實際使用 R 語言中的 mada 套件進行分析與繪圖。最後,我也會簡單對比機器學習(Python)中常見的 精確率、召回率、F2-score 等概念,幫助讀者跨領域銜接。
🧠 一次搞懂 TP、FP、FN、TN
在診斷工具或分類模型中,通常會將預測結果與真實情況交叉比對,形成一個 2×2 混淆矩陣:
真實為陽性(有病)真實為陰性(無病)預測為陽性TP(真陽性)FP(假陽性)預測為陰性FN(假陰性)TN(真陰性)

- TP(True Positive):有病且被正確預測出來 ✅
- TN(True Negative):沒病且被正確預測為沒病 ✅
- FP(False Positive):沒病卻被誤判為有病 ❌(偽陽性)
- FN(False Negative):有病卻被誤判為沒病 ❌(偽陰性)
常用衍生指標:
- 敏感度(Sensitivity) = TP / (TP + FN)
→ 真正有病的人中,被成功找出來的比例。
在衰弱篩檢中,寧可錯殺也不放過的時候,敏感度就非常重要。 - 特異度(Specificity) = TN / (TN + FP)
→ 真正沒病的人中,被正確排除的比例。
📈 AUC 與森林圖的角色
在臨床文獻中,單看一個研究的敏感度、特異度並不足夠,因為不同研究的樣本數、族群、切點都不同。因此學者常使用 AUC(Area Under the ROC Curve) 來綜合評估模型的區辨能力。AUC 越接近 1 表示表現越好。
而 森林圖(Forest Plot) 則是用來 視覺化統合分析結果 的好工具。它可以同時呈現多個研究的敏感度(或特異度)及其信賴區間,幫助讀者一眼看出哪些研究結果一致、哪些是離群值。
















