完整影像處理決策流程圖

更新 發佈閱讀 4 分鐘

🧭 STEP 0:先問自己一個最重要的問題

你的目標是什麼?

A. 我要數值分析(強度、清晰度、瑕疵評分)
B. 我要抽輪廓(找邊界、找圓、找線)
C. 我要做分類或分割

不同目的,走不同路線。


🟦 路線 A:強度分析型(Gradient / Sharpness / Defect Score)

適合你目前 ROI、圓形邊界完整度、瑕疵強度分析。


流程圖

原始影像

灰階轉換

是否有雜訊?
├─ 是 → Gaussian Blur
└─ 否 → 略過

Sobel 計算 Gx, Gy

計算 Gradient Magnitude

做統計(平均值 / max / 區域能量)

得到數值型評分

為什麼用 Sobel?

因為你要的是:

✔ 連續強度資訊


✔ 可量化 ✔ 可做統計


而不是二值邊界。


適用場景

  • 圓邊界清晰度
  • 瑕疵強度評分
  • 刀口鋒利度
  • 表面粗糙度趨勢

🟩 路線 B:輪廓抽取型(Edge Extraction)

目標是取得乾淨邊界。


流程圖

原始影像

灰階

Gaussian Blur

Canny

取得邊緣圖

輪廓分析 / Hough Transform

是否要手動 threshold?

光源穩定?

穩定 → 固定 threshold
不穩定 → Auto Canny

適用場景

  • 找圓(Hough Circle)
  • 找線(Hough Line)
  • 計算物件周長
  • 物件定位

🟨 路線 C:分割 / 區域偵測型

如果你要的是:

  • 分割缺陷區域
  • 抓 blob
  • 面積計算

流程圖

原始影像

灰階

是否光照均勻?
├─ 不均勻 → 自適應 threshold
└─ 均勻 → Otsu threshold

Morphology(去噪 / 填洞)

Connected Components / Contour

🧠 決策樹總整理

我想做什麼?

├─ 分析強度? → Sobel

├─ 抽輪廓?
│ ├─ 光源穩定 → Canny 固定閾值
│ └─ 光源變動 → Auto Canny

└─ 分割區域?
├─ 光照均勻 → Otsu
└─ 光照不均 → Adaptive Threshold

🔍 更細節的工程決策


Q1:影像有很多雜訊?

✔ 一定先做 Gaussian Blur


✔ 不然 Sobel/Canny 都會被影響



Q2:我要量化邊緣「強弱」?

→ Sobel

因為 Canny 只會給你 0 或 255。


Q3:我要邊界位置?

→ Canny

因為它有 Non-Max Suppression,線會細。


Q4:我要自動化批次分析?

→ Auto Canny


→ 或 Sobel + 自動 threshold



📌 工程級 Pipeline 建議(給你這種 ROI 分析)

假設你做圓形瑕疵分析:


版本一:邊界完整度分析

ROI

Sobel

取圓周區域

計算平均梯度

作為圓邊界品質分數

版本二:找圓 + 分析

ROI

Auto Canny

Hough Circle

取得圓

再用 Sobel 分析圓周梯度


留言
avatar-img
螃蟹_crab的沙龍
168會員
322內容數
本業是影像辨識軟體開發,閒暇時間進修AI相關內容,將學習到的內容寫成文章分享。 興趣是攝影,踏青,探索未知領域。 人生就是不斷的挑戰及自我認清,希望老了躺在床上不會後悔自己什麼都沒做。
螃蟹_crab的沙龍的其他內容
2025/09/24
適合:Windows 10/11、Python 3.9~3.12 測試環境paddleocr==3.2.0、paddlepaddle==3. 使用 TextRecognition 文字辨識模型 以下參考官網 1️⃣ 建立與啟動虛擬環境 建議用 virtualenv 或 conda(避免污
2025/09/24
適合:Windows 10/11、Python 3.9~3.12 測試環境paddleocr==3.2.0、paddlepaddle==3. 使用 TextRecognition 文字辨識模型 以下參考官網 1️⃣ 建立與啟動虛擬環境 建議用 virtualenv 或 conda(避免污
2025/09/24
單純比較單行文字的結果 PaddleOCR 辨識率及速度就高好多,資料集為英文加數字 詳細比較結果 PaddleOCR只有少數O跟0會誤判 1. Tesseract 的 AI 模型 版本差異 Tesseract 3 以前:主要是傳統 OCR(字元切割 → 模板匹配/分類器)。
Thumbnail
2025/09/24
單純比較單行文字的結果 PaddleOCR 辨識率及速度就高好多,資料集為英文加數字 詳細比較結果 PaddleOCR只有少數O跟0會誤判 1. Tesseract 的 AI 模型 版本差異 Tesseract 3 以前:主要是傳統 OCR(字元切割 → 模板匹配/分類器)。
Thumbnail
2025/06/20
在工業視覺、文字辨識、或醫學影像中,我們常常需要對物件的線條進行寬度一致性分析。本篇文章將深入解析一段實作程式碼,這段程式會針對輸入的 二值影像區塊,執行: 骨架化(Skeletonization) 距離轉換(Distance Transform) 線寬統計分析(Mean, Std, CV 等
Thumbnail
2025/06/20
在工業視覺、文字辨識、或醫學影像中,我們常常需要對物件的線條進行寬度一致性分析。本篇文章將深入解析一段實作程式碼,這段程式會針對輸入的 二值影像區塊,執行: 骨架化(Skeletonization) 距離轉換(Distance Transform) 線寬統計分析(Mean, Std, CV 等
Thumbnail
看更多
你可能也想看
Thumbnail
本文分析導演巴里・柯斯基(Barrie Kosky)如何運用極簡的舞臺配置,將布萊希特(Bertolt Brecht)的「疏離效果」轉化為視覺奇觀與黑色幽默,探討《三便士歌劇》在當代劇場中的新詮釋,並藉由舞臺、燈光、服裝、音樂等多方面,分析該作如何在保留批判核心的同時,觸及觀眾的觀看位置與人性幽微。
Thumbnail
本文分析導演巴里・柯斯基(Barrie Kosky)如何運用極簡的舞臺配置,將布萊希特(Bertolt Brecht)的「疏離效果」轉化為視覺奇觀與黑色幽默,探討《三便士歌劇》在當代劇場中的新詮釋,並藉由舞臺、燈光、服裝、音樂等多方面,分析該作如何在保留批判核心的同時,觸及觀眾的觀看位置與人性幽微。
Thumbnail
這篇文章說明 NTSC 與 PAL 兩種影像格式的差異、適用範圍,並提供選擇指南及修復影片播放問題的建議。
Thumbnail
這篇文章說明 NTSC 與 PAL 兩種影像格式的差異、適用範圍,並提供選擇指南及修復影片播放問題的建議。
Thumbnail
短影音時代,如何讓影片更吸睛?「背景模糊」是提升影片質感的利器。本文精選5款跨平臺影片背景模糊工具,包含電腦軟體、手機 App 及網頁工具,不論是 YouTuber、IG Reels 或 TikTok 創作者,都能找到適合自己的解決方案,輕鬆讓主體更突出、畫面更有景深感,甚至保護隱私!
Thumbnail
短影音時代,如何讓影片更吸睛?「背景模糊」是提升影片質感的利器。本文精選5款跨平臺影片背景模糊工具,包含電腦軟體、手機 App 及網頁工具,不論是 YouTuber、IG Reels 或 TikTok 創作者,都能找到適合自己的解決方案,輕鬆讓主體更突出、畫面更有景深感,甚至保護隱私!
Thumbnail
這是一場修復文化與重建精神的儀式,觀眾不需要完全看懂《遊林驚夢:巧遇Hagay》,但你能感受心與土地團聚的渴望,也不急著在此處釐清或定義什麼,但你的在場感受,就是一條線索,關於如何找著自己的路徑、自己的聲音。
Thumbnail
這是一場修復文化與重建精神的儀式,觀眾不需要完全看懂《遊林驚夢:巧遇Hagay》,但你能感受心與土地團聚的渴望,也不急著在此處釐清或定義什麼,但你的在場感受,就是一條線索,關於如何找著自己的路徑、自己的聲音。
Thumbnail
背景:從冷門配角到市場主線,算力與電力被重新定價   小P從2008進入股市,每一個時期的投資亮點都不同,記得2009蘋果手機剛上市,當時蘋果只要在媒體上提到哪一間供應鏈,隔天股價就有驚人的表現,當時光學鏡頭非常熱門,因為手機第一次搭上鏡頭可以拍照,也造就傳統相機廠的殞落,如今手機已經全面普及,題
Thumbnail
背景:從冷門配角到市場主線,算力與電力被重新定價   小P從2008進入股市,每一個時期的投資亮點都不同,記得2009蘋果手機剛上市,當時蘋果只要在媒體上提到哪一間供應鏈,隔天股價就有驚人的表現,當時光學鏡頭非常熱門,因為手機第一次搭上鏡頭可以拍照,也造就傳統相機廠的殞落,如今手機已經全面普及,題
Thumbnail
5 月將於臺北表演藝術中心映演的「2026 北藝嚴選」《海妲・蓋柏樂》,由臺灣劇團「晃晃跨幅町」製作,本文將以從舞台符號、聲音與表演調度切入,討論海妲・蓋柏樂在父權社會結構下的困境,並結合榮格心理學與馮.法蘭茲對「阿尼姆斯」與「永恆少年」原型的分析,理解女人何以走向精神性的操控、毀滅與死亡。
Thumbnail
5 月將於臺北表演藝術中心映演的「2026 北藝嚴選」《海妲・蓋柏樂》,由臺灣劇團「晃晃跨幅町」製作,本文將以從舞台符號、聲音與表演調度切入,討論海妲・蓋柏樂在父權社會結構下的困境,並結合榮格心理學與馮.法蘭茲對「阿尼姆斯」與「永恆少年」原型的分析,理解女人何以走向精神性的操控、毀滅與死亡。
Thumbnail
這篇文章討論影片降噪的技巧,包含聲音降噪和畫面雜訊消除的方法,並提供多種工具和軟體的建議,例如 Audacity、HitPaw VikPea、Premiere Pro 和 Final Cut Pro 等。此外,文章也說明如何在拍攝階段避免噪音和噪點的產生,例如選擇安靜的環境、使用高品質麥克風等。
Thumbnail
這篇文章討論影片降噪的技巧,包含聲音降噪和畫面雜訊消除的方法,並提供多種工具和軟體的建議,例如 Audacity、HitPaw VikPea、Premiere Pro 和 Final Cut Pro 等。此外,文章也說明如何在拍攝階段避免噪音和噪點的產生,例如選擇安靜的環境、使用高品質麥克風等。
Thumbnail
許多視覺設計師直覺會選擇加入「平面設計」或「廣告創作」相關工會,但現代設計早已不只是製作畫面。視覺設計更強調 品牌定位、溝通策略與專案協調,角色本質更貼近「企劃管理」。 因此,「台北市企劃經理人職業工會」反而是更加貼合視覺設計師真實工作內容的選擇。
Thumbnail
許多視覺設計師直覺會選擇加入「平面設計」或「廣告創作」相關工會,但現代設計早已不只是製作畫面。視覺設計更強調 品牌定位、溝通策略與專案協調,角色本質更貼近「企劃管理」。 因此,「台北市企劃經理人職業工會」反而是更加貼合視覺設計師真實工作內容的選擇。
Thumbnail
影片打不開怎麼辦?完整教學帶你修復損毀影片! 在使用電腦播放影片時,你是否遇過這種情況:影片打不開、跳出錯誤訊息,甚至整個播放器當機?這種問題不僅讓人懊惱,尤其當影片內容珍貴,像是回憶影片、重要剪輯檔案,心情更是瞬間跌到谷底。 別擔心,這篇文章將帶你深入了解為什麼影片打不開,並教你幾種實用的方法
Thumbnail
影片打不開怎麼辦?完整教學帶你修復損毀影片! 在使用電腦播放影片時,你是否遇過這種情況:影片打不開、跳出錯誤訊息,甚至整個播放器當機?這種問題不僅讓人懊惱,尤其當影片內容珍貴,像是回憶影片、重要剪輯檔案,心情更是瞬間跌到谷底。 別擔心,這篇文章將帶你深入了解為什麼影片打不開,並教你幾種實用的方法
Thumbnail
《咒》的劇情編排時序交錯並且有很多細節,你看到了嗎? 本篇詳述完整劇情、順時敘述。分為三段:六年前→六年間→六年後的現在。 回顧完劇情再來看看下篇的16大QA解惑吧!
Thumbnail
《咒》的劇情編排時序交錯並且有很多細節,你看到了嗎? 本篇詳述完整劇情、順時敘述。分為三段:六年前→六年間→六年後的現在。 回顧完劇情再來看看下篇的16大QA解惑吧!
Thumbnail
66. 透過紅色玻璃片,觀看所有景象呈現深淺不一的紅色色調。 用來拍攝星空,則所有恆星都呈明亮不同的紅色。 現透過望遠鏡用相機拍攝星空,針對同一天區,分別以紅色 及藍色玻璃片各拍一幅影像。依此可獲得恆星的何種訊息? A 比對兩幅影像,能判斷出恆星的年齡 B
Thumbnail
66. 透過紅色玻璃片,觀看所有景象呈現深淺不一的紅色色調。 用來拍攝星空,則所有恆星都呈明亮不同的紅色。 現透過望遠鏡用相機拍攝星空,針對同一天區,分別以紅色 及藍色玻璃片各拍一幅影像。依此可獲得恆星的何種訊息? A 比對兩幅影像,能判斷出恆星的年齡 B
Thumbnail
當您準備印刷時,選擇正確的檔案格式至關重要。本文介紹了常見的印刷檔案格式,包括向量檔(如EPS、AI、PDF)和位圖檔(如JPG、TIFF、PNG),並解釋了每種格式的特點和使用場景。了解如何根據設計需求選擇合適的檔案格式,以及如何準備高解析度、正確色彩模式的檔案,將有助於確保您的印刷品質量完美無瑕
Thumbnail
當您準備印刷時,選擇正確的檔案格式至關重要。本文介紹了常見的印刷檔案格式,包括向量檔(如EPS、AI、PDF)和位圖檔(如JPG、TIFF、PNG),並解釋了每種格式的特點和使用場景。了解如何根據設計需求選擇合適的檔案格式,以及如何準備高解析度、正確色彩模式的檔案,將有助於確保您的印刷品質量完美無瑕
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News