【混淆矩陣】為什麼準確率高,模型卻一團亂?用快篩案例秒懂混淆矩陣、精確率與召回率!

更新 發佈閱讀 3 分鐘

從最難懂的痛點開始

我是「iPAS AI 自學路」的創辦人。身為一位非資訊本科系40 歲中年上班族,我深知在零碎時間內,要理解iPAS證照那些艱澀的統計名詞有多痛苦。因此,我決定從我最難懂的主題——混淆矩陣精確率/召回率開始,用最白話的方式為你「翻譯」AI 決策的核心。

我們就用大家最熟悉的COVID-19快篩,來當作我們評估的AI模型。



一、 混淆矩陣:快篩結果的四種情境

我們不能只看快篩的「總分」(準確度),必須知道它「錯在哪裡」。混淆矩陣(Confusion Matrix)就是這份篩檢結果的診斷報告,將判斷結果分成兩大類共四種情境:

✅ 正確的結果(快篩判斷正確!)

  1. TP (真陽性): 抓對了!(神準)實際已感染,快篩結果為陽性。
  2. TN (真陰性): 排除了!(安全)實際未感染,快篩結果為陰性。

❌ 錯誤的結果(快篩搞混了!)

  1. FP (偽陽性): 誤殺了!(虛驚一場)實際未感染,但快篩卻呈現陽性。後果是造成不必要的隔離、PCR資源浪費,這就是「誤判成本」。
  2. FN (偽陰性): 漏掉了!(潛在危機)實際已感染,但快篩卻呈現陰性。嚴重後果: 讓感染者以為安全而繼續趴趴走,造成疫情擴散,這就是「錯失成本」。

二、 精確率 vs. 召回率:篩檢策略的兩難

身為 AI 應用規劃師,您必須根據業務目標(例如防疫策略),決定您的篩檢模型(AI)應該「追求精準」還是「追求全面」:

1. 精確率 (Precision):追求品質,避免誤殺 (FP)

  • 白話問句:「在所有被快篩喊『陽性』的人中,到底有多少比例是真的感染者?」
  • 應用場景:核酸檢測(PCR)。由於 PCR 結果會導致嚴格的隔離與治療,我們必須確保被判定為陽性的人是極度精準的,寧可犧牲一些速度,也要降低誤判。

2. 召回率 (Recall):追求全面,避免漏放 (FN)

  • 白話問句:「在所有『真正已感染』的人中,快篩成功找出了多少比例?」
  • 應用場景:大規模快篩普篩。在疫情爆發初期,目標是儘快找出所有潛在感染者,避免任何遺漏。這時會優先追求高召回率,寧可多抓一些偽陽性(FP),也不能放過任何一個已感染者(FN)。

記住,這兩者是蹺蹺板的兩端,您的防疫或商業目標,決定了您該優先追求哪一個指標。


下集預告:高準確率背後的陷阱!

當資料極度不平衡時,例如全國 99.9% 的人都是陰性,此時一個「永遠猜陰性」的模型也能達到 99.9% 的準確度,但它根本抓不到任何病人!

在我的Youtube頻道[統計分析2] 讓人混淆的混淆矩陣、精確率與召回率這個影片中,將揭露 「準確度悖論」,並介紹更可靠的 PR 曲線,帶你看清如何看清AI的真正實力。

歡迎訂閱我的YouTube頻道與方格子,用最高效的方式一起學習!

留言
avatar-img
iPAS自學路|AI應用規劃師備考筆記與考點解析
372會員
97內容數
職場資深管理職,非資訊本科,一次通過 iPAS AI 應用規劃師初級與中級雙證照。頻道累積 200+ 集影片、80+ 篇備考文章、沙龍會員 300+ 人。白話考點解析搭配 YouTube 影音導航,專為非本科上班族設計的通勤時間備考工具。
你可能也想看
Thumbnail
透明立體方練習,使用AI向量繪圖軟體
Thumbnail
透明立體方練習,使用AI向量繪圖軟體
Thumbnail
這是什麼大問題嗎?這樣就寫一篇文章,會不會太混了! 會! 其實蠻混的! 哈哈哈! 1.英文不好,乾脆用中文。就用微軟 Copilot 設計工具 的網址在此。好啦!
Thumbnail
這是什麼大問題嗎?這樣就寫一篇文章,會不會太混了! 會! 其實蠻混的! 哈哈哈! 1.英文不好,乾脆用中文。就用微軟 Copilot 設計工具 的網址在此。好啦!
Thumbnail
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 回顧 AI說書 - 從0開始 - 129 中說,Bidirectional Encoder Representations from Transformers (BER
Thumbnail
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 回顧 AI說書 - 從0開始 - 129 中說,Bidirectional Encoder Representations from Transformers (BER
Thumbnail
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 目前我們已經完成: Single-Head Attention 數學說明:AI說書 - 從0開始 - 52 Multi-Head Attention 數學說明:
Thumbnail
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 目前我們已經完成: Single-Head Attention 數學說明:AI說書 - 從0開始 - 52 Multi-Head Attention 數學說明:
Thumbnail
背景:從冷門配角到市場主線,算力與電力被重新定價   小P從2008進入股市,每一個時期的投資亮點都不同,記得2009蘋果手機剛上市,當時蘋果只要在媒體上提到哪一間供應鏈,隔天股價就有驚人的表現,當時光學鏡頭非常熱門,因為手機第一次搭上鏡頭可以拍照,也造就傳統相機廠的殞落,如今手機已經全面普及,題
Thumbnail
背景:從冷門配角到市場主線,算力與電力被重新定價   小P從2008進入股市,每一個時期的投資亮點都不同,記得2009蘋果手機剛上市,當時蘋果只要在媒體上提到哪一間供應鏈,隔天股價就有驚人的表現,當時光學鏡頭非常熱門,因為手機第一次搭上鏡頭可以拍照,也造就傳統相機廠的殞落,如今手機已經全面普及,題
Thumbnail
本文分析導演巴里・柯斯基(Barrie Kosky)如何運用極簡的舞臺配置,將布萊希特(Bertolt Brecht)的「疏離效果」轉化為視覺奇觀與黑色幽默,探討《三便士歌劇》在當代劇場中的新詮釋,並藉由舞臺、燈光、服裝、音樂等多方面,分析該作如何在保留批判核心的同時,觸及觀眾的觀看位置與人性幽微。
Thumbnail
本文分析導演巴里・柯斯基(Barrie Kosky)如何運用極簡的舞臺配置,將布萊希特(Bertolt Brecht)的「疏離效果」轉化為視覺奇觀與黑色幽默,探討《三便士歌劇》在當代劇場中的新詮釋,並藉由舞臺、燈光、服裝、音樂等多方面,分析該作如何在保留批判核心的同時,觸及觀眾的觀看位置與人性幽微。
Thumbnail
這是一場修復文化與重建精神的儀式,觀眾不需要完全看懂《遊林驚夢:巧遇Hagay》,但你能感受心與土地團聚的渴望,也不急著在此處釐清或定義什麼,但你的在場感受,就是一條線索,關於如何找著自己的路徑、自己的聲音。
Thumbnail
這是一場修復文化與重建精神的儀式,觀眾不需要完全看懂《遊林驚夢:巧遇Hagay》,但你能感受心與土地團聚的渴望,也不急著在此處釐清或定義什麼,但你的在場感受,就是一條線索,關於如何找著自己的路徑、自己的聲音。
Thumbnail
5 月將於臺北表演藝術中心映演的「2026 北藝嚴選」《海妲・蓋柏樂》,由臺灣劇團「晃晃跨幅町」製作,本文將以從舞台符號、聲音與表演調度切入,討論海妲・蓋柏樂在父權社會結構下的困境,並結合榮格心理學與馮.法蘭茲對「阿尼姆斯」與「永恆少年」原型的分析,理解女人何以走向精神性的操控、毀滅與死亡。
Thumbnail
5 月將於臺北表演藝術中心映演的「2026 北藝嚴選」《海妲・蓋柏樂》,由臺灣劇團「晃晃跨幅町」製作,本文將以從舞台符號、聲音與表演調度切入,討論海妲・蓋柏樂在父權社會結構下的困境,並結合榮格心理學與馮.法蘭茲對「阿尼姆斯」與「永恆少年」原型的分析,理解女人何以走向精神性的操控、毀滅與死亡。
Thumbnail
由於不是這方面的專業,所以一切靠爬文嘗試,我的學習之路不見得正確,就記錄一下自我學習的過程。若有高手見文願指點一二,實屬我之榮幸。
Thumbnail
由於不是這方面的專業,所以一切靠爬文嘗試,我的學習之路不見得正確,就記錄一下自我學習的過程。若有高手見文願指點一二,實屬我之榮幸。
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News