物件偵測評估指標 (Object Detection Metrics)

更新 發佈閱讀 5 分鐘

物件偵測模型的評估指標用於衡量模型在定位和分類圖像中物體的性能。與單純的分類任務不同,物件偵測需要同時評估模型預測的邊界框是否準確以及框內的物體類別是否正確。

以下是一些主要的物件偵測評估指標:

1. 交並比 (Intersection over Union, IoU):

IoU 是衡量模型預測的邊界框 (Bounding Box) 與真實標註的邊界框之間重疊程度的指標。它定義為兩個邊界框交集區域的面積除以它們並集區域的面積。

IoU = Area(Predicted 框 ∩ Ground Truth 框) / Area(Predicted 框 ∪ Ground Truth 框)

IoU 的值介於 0 到 1 之間,值越高表示預測框與真實框的重疊程度越高,定位越準確。通常會設定一個 IoU 的閾值(例如 0.5、0.75)來判斷一個預測是否為真陽性。

2. 精確度 (Precision) 和 召回率 (Recall):

與分類任務類似,物件偵測也使用精確度和召回率來評估模型的性能。但這裡的定義稍有不同,需要結合 IoU 的閾值來判斷預測結果的真假。

  • 真陽性 (TP): 模型預測的邊界框與真實標註的邊界框的 IoU 大於設定的閾值,並且預測的類別與真實類別一致。
  • 假陽性 (FP): 模型預測的邊界框與任何真實標註的邊界框的 IoU 都小於閾值,或者預測的類別不正確。
  • 假負性 (FN): 圖像中存在真實標註的物體,但模型沒有檢測到。

基於這些定義,我們可以計算精確度和召回率:

Precision = TP / (TP + FP) Recall = TP / (TP + FN)

3. 平均精確度 (Average Precision, AP):

AP 是一種綜合考慮了模型在不同召回率水平下的精確度的指標。對於每個類別,AP 的計算過程如下:

  • 將模型對該類別的所有預測按照置信度降序排列。
  • 計算在不同置信度閾值下的精確度和召回率。
  • 繪製精確度-召回率曲線(PR 曲線)。
  • AP 是 PR 曲線下的面積。有多種計算 AP 的方法,例如在特定的召回率點(例如 0.1, 0.2, ..., 1.0)上取精確度的平均值,或者使用更精細的插值方法。

4. 平均精度均值 (Mean Average Precision, mAP):

mAP 是物件偵測模型最常用的評估指標。它是指模型在所有類別上的平均精確度的平均值。

mAP = (AP_class1 + AP_class2 + ... + AP_classN) / N

其中 N 是類別的總數。

通常會在 mAP 後面加上 IoU 的閾值來明確評估標準,例如 [email protected] 表示在 IoU 閾值為 0.5 時計算得到的 mAP,mAP@[0.5:0.95] 表示在 IoU 閾值從 0.5 到 0.95,以 0.05 為步長計算得到的 AP 的平均值再求所有類別的平均。

5. COCO 評估指標:

COCO (Common Objects in Context) 數據集是一個廣泛使用的物件偵測、分割和字幕數據集,它定義了一套更詳細的評估指標,包括不同 IoU 閾值下的 mAP:

  • mAP@[.5:.95]: 在 IoU 從 0.5 到 0.95,步長為 0.05 的多個閾值上的平均 AP。這是主要的評估指標。
  • [email protected]: 在 IoU 閾值為 0.5 時的 AP 平均值。
  • [email protected]: 在 IoU 閾值為 0.75 時的 AP 平均值。
  • AP for small, medium, large objects: 分別計算小、中、大尺寸物體的 AP。

這些更詳細的指標可以更全面地評估模型在不同情況下的性能。

總結:

物件偵測的評估需要同時考慮定位的準確性(通過 IoU)和分類的正確性(通過精確度和召回率)。mAP 是一個綜合性的指標,能夠很好地反映模型在整體上的性能。理解這些評估指標對於比較不同的物件偵測模型和改進模型性能至關重要。

留言
avatar-img
郝信華 iPAS AI應用規劃師 學習筆記
46會員
572內容數
現職 : 富邦建設資訊副理 證照:經濟部 iPAS AI應用規劃師 初級+中級(數據分析) AWS AIF-C01 AWS CLF-C02 Microsoft AI-900 其他:富邦美術館志工
2025/05/27
分類任務評估指標是用於衡量機器學習分類模型性能的各種量化指標。它們幫助我們了解模型在將數據點劃分到不同類別時的表現如何,並比較不同模型之間的優劣。 以下是一些最常見的分類任務評估指標: 1. 混淆矩陣 (Confusion Matrix): 混淆矩陣是一個表格,用於總結分類模型的預測結果。對於
2025/05/27
分類任務評估指標是用於衡量機器學習分類模型性能的各種量化指標。它們幫助我們了解模型在將數據點劃分到不同類別時的表現如何,並比較不同模型之間的優劣。 以下是一些最常見的分類任務評估指標: 1. 混淆矩陣 (Confusion Matrix): 混淆矩陣是一個表格,用於總結分類模型的預測結果。對於
2025/05/27
欠擬合 (Underfitting) 是指在機器學習模型的訓練過程中,模型沒有充分學習到訓練數據中的規律和模式,導致在訓練集和測試集上的表現都不夠理想的現象。簡單來說,模型過於簡單,無法捕捉到數據之間的複雜關係。 為什麼會發生欠擬合? 欠擬合通常在以下情況下更容易發生: 模型複雜度過低: 模型
2025/05/27
欠擬合 (Underfitting) 是指在機器學習模型的訓練過程中,模型沒有充分學習到訓練數據中的規律和模式,導致在訓練集和測試集上的表現都不夠理想的現象。簡單來說,模型過於簡單,無法捕捉到數據之間的複雜關係。 為什麼會發生欠擬合? 欠擬合通常在以下情況下更容易發生: 模型複雜度過低: 模型
2025/05/27
過擬合 (Overfitting) 是指在機器學習模型的訓練過程中,模型過於完美地擬合了訓練數據的細節和雜訊,以至於在面對新的、未見過的數據時表現很差的現象。換句話說,模型在訓練集上表現出色,但在測試集或真實應用場景中的泛化能力很弱。 為什麼會發生過擬合? 過擬合通常在以下情況下更容易發生:
2025/05/27
過擬合 (Overfitting) 是指在機器學習模型的訓練過程中,模型過於完美地擬合了訓練數據的細節和雜訊,以至於在面對新的、未見過的數據時表現很差的現象。換句話說,模型在訓練集上表現出色,但在測試集或真實應用場景中的泛化能力很弱。 為什麼會發生過擬合? 過擬合通常在以下情況下更容易發生:
看更多
你可能也想看
Thumbnail
[OpenCV應用][Python]找出圖像中的四個方位的邊緣點求出寬高 呈上篇應用Numpy找到的座標點,那我們如何捨棄掉差異過大的座標點呢? 可能圖像物件邊緣不佳,採樣就會差異過大,造成計算出的寬高是不準確的。 遇到這種狀況,就可以使用下方的程式範例來篩選座標點。 為求方便,此範例跟圖
Thumbnail
[OpenCV應用][Python]找出圖像中的四個方位的邊緣點求出寬高 呈上篇應用Numpy找到的座標點,那我們如何捨棄掉差異過大的座標點呢? 可能圖像物件邊緣不佳,採樣就會差異過大,造成計算出的寬高是不準確的。 遇到這種狀況,就可以使用下方的程式範例來篩選座標點。 為求方便,此範例跟圖
Thumbnail
若說易卜生的《玩偶之家》為 19 世紀的女性,開啟了一扇離家的窄門,那麼《海妲.蓋柏樂》展現的便是門後的窒息世界。本篇文章由劇場演員 Amily 執筆,同為熟稔文本的演員,亦是深刻體察制度縫隙的當代女性,此文所看見的不僅僅是崩壞前夕的最後發聲,更是女人被迫置於冷酷的制度之下,步步陷入無以言說的困境。
Thumbnail
若說易卜生的《玩偶之家》為 19 世紀的女性,開啟了一扇離家的窄門,那麼《海妲.蓋柏樂》展現的便是門後的窒息世界。本篇文章由劇場演員 Amily 執筆,同為熟稔文本的演員,亦是深刻體察制度縫隙的當代女性,此文所看見的不僅僅是崩壞前夕的最後發聲,更是女人被迫置於冷酷的制度之下,步步陷入無以言說的困境。
Thumbnail
介紹OpenCV中的cv2.matchTemplate和cv2.minMaxLoc函數的使用方法和參數,提供程式範例以及相關特徵匹配的詳細介紹,讓讀者對此有更深入的瞭解。
Thumbnail
介紹OpenCV中的cv2.matchTemplate和cv2.minMaxLoc函數的使用方法和參數,提供程式範例以及相關特徵匹配的詳細介紹,讓讀者對此有更深入的瞭解。
Thumbnail
全新版本的《三便士歌劇》如何不落入「復刻經典」的巢臼,反而利用華麗的秀場視覺,引導觀眾在晚期資本主義的消費愉悅之中,而能驚覺「批判」本身亦可能被收編——而當絞繩升起,這場關於如何生存的黑色遊戲,又將帶領新時代的我們走向何種後現代的自我解構?
Thumbnail
全新版本的《三便士歌劇》如何不落入「復刻經典」的巢臼,反而利用華麗的秀場視覺,引導觀眾在晚期資本主義的消費愉悅之中,而能驚覺「批判」本身亦可能被收編——而當絞繩升起,這場關於如何生存的黑色遊戲,又將帶領新時代的我們走向何種後現代的自我解構?
Thumbnail
在影像辨識中,若遇到物件與背景難以分辨的狀況下,先做一下色彩分析,知道了色彩強度階層上的像素數,有助於了解後續需要做什麼處理,比較好分割出辨識物。 若想辨識的物件與背景的RGB值過於接近,也比較好說明此狀況,為什麼較難分割出物件。 成果呈現 第一張圖:左邊為原圖,右邊為分析結果的圖,用其他顏
Thumbnail
在影像辨識中,若遇到物件與背景難以分辨的狀況下,先做一下色彩分析,知道了色彩強度階層上的像素數,有助於了解後續需要做什麼處理,比較好分割出辨識物。 若想辨識的物件與背景的RGB值過於接近,也比較好說明此狀況,為什麼較難分割出物件。 成果呈現 第一張圖:左邊為原圖,右邊為分析結果的圖,用其他顏
Thumbnail
本文將說明如何去辨識出圖片文字​位置及高寬。
Thumbnail
本文將說明如何去辨識出圖片文字​位置及高寬。
Thumbnail
本文深度解析賽勒布倫尼科夫的舞臺作品《傳奇:帕拉贊諾夫的十段殘篇》,如何以十段殘篇,結合帕拉贊諾夫的電影美學、象徵意象與當代政治流亡抗爭,探討藝術在儀式消失的現代社會如何承接意義,並展現不羈的自由靈魂。
Thumbnail
本文深度解析賽勒布倫尼科夫的舞臺作品《傳奇:帕拉贊諾夫的十段殘篇》,如何以十段殘篇,結合帕拉贊諾夫的電影美學、象徵意象與當代政治流亡抗爭,探討藝術在儀式消失的現代社會如何承接意義,並展現不羈的自由靈魂。
Thumbnail
針對辨識物的不同,流程就會不一樣,在依照現實狀況進行刪減,以下說明為個人常用的流程。 基本流程: 讀圖 灰階 濾波 (看圖片雜訊多不多) 二值化 連通區域 特徵篩選 特徵資訊 辨識 - (OCR,量測,瑕疵檢測等。) 名詞介紹 Gray 灰階 將原始的彩色圖像轉換為灰階圖
Thumbnail
針對辨識物的不同,流程就會不一樣,在依照現實狀況進行刪減,以下說明為個人常用的流程。 基本流程: 讀圖 灰階 濾波 (看圖片雜訊多不多) 二值化 連通區域 特徵篩選 特徵資訊 辨識 - (OCR,量測,瑕疵檢測等。) 名詞介紹 Gray 灰階 將原始的彩色圖像轉換為灰階圖
Thumbnail
直方圖是對圖像中像素強度分布的圖形表示。通過分析直方圖,我們可以獲得有關圖像對比度、亮度和色彩分佈的有用信息。
Thumbnail
直方圖是對圖像中像素強度分布的圖形表示。通過分析直方圖,我們可以獲得有關圖像對比度、亮度和色彩分佈的有用信息。
Thumbnail
觀看本文將可以學習到如何利用Numpy求得物件的邊緣點,及算出物件的寬跟高。 有詳細的程式邏輯說明,及各函式用法說明。 綠點及紅點則是採樣到的邊界點,比較粗的點是偵測到的最大值 完整程式碼 import cv2 import numpy as np import matplotl
Thumbnail
觀看本文將可以學習到如何利用Numpy求得物件的邊緣點,及算出物件的寬跟高。 有詳細的程式邏輯說明,及各函式用法說明。 綠點及紅點則是採樣到的邊界點,比較粗的點是偵測到的最大值 完整程式碼 import cv2 import numpy as np import matplotl
Thumbnail
長期以來,西方美學以《維特魯威人》式的幾何比例定義「完美身體」,這種視覺標準無形中成為殖民擴張與種族分類的暴力工具。本文透過分析奈及利亞編舞家庫德斯.奧尼奎庫的舞作《轉轉生》,探討當代非洲舞蹈如何跳脫「標本式」的文化觀看。
Thumbnail
長期以來,西方美學以《維特魯威人》式的幾何比例定義「完美身體」,這種視覺標準無形中成為殖民擴張與種族分類的暴力工具。本文透過分析奈及利亞編舞家庫德斯.奧尼奎庫的舞作《轉轉生》,探討當代非洲舞蹈如何跳脫「標本式」的文化觀看。
Thumbnail
特徵工程是機器學習中的核心技術,通過將原始數據轉換為有意義的特徵,以提升模型的準確性和穩定性。常見的特徵工程方法包括異常值檢測、特徵轉換、特徵縮放、特徵表示、特徵選擇和特徵提取。本文將深入探討這些方法的適用情況及具體實施流程,以幫助讀者有效利用特徵工程來優化機器學習模型表現。
Thumbnail
特徵工程是機器學習中的核心技術,通過將原始數據轉換為有意義的特徵,以提升模型的準確性和穩定性。常見的特徵工程方法包括異常值檢測、特徵轉換、特徵縮放、特徵表示、特徵選擇和特徵提取。本文將深入探討這些方法的適用情況及具體實施流程,以幫助讀者有效利用特徵工程來優化機器學習模型表現。
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News