使用 YOLO v8 建立基本圖片辨識並匯出 CSV 資料檔案

更新 發佈閱讀 5 分鐘

目的

這次主題是要使用 YOLO 8 來建立基本圖片辨識, 並且產出 csv 的資料檔案。

步驟

進入 COLAB

首先需要先進入 google 的 colab, 就可以省掉安裝 python 的環境, 全部的內容皆在雲端跑, 也不會吃電腦太多的資源。

安裝 YOLO 8

!pip install ultralytics

這個指令主要是用來安裝 YOLO 的套件, 可以看見執行後會 import 很多套件, 用於之後圖片分類辨識的基礎

Import 需要的資源

from ultralytics import YOLO
import cv2
from matplotlib import pyplot as pyplot​

讀取圖片

將圖片內容放入左邊的檔案當中

vocus|新世代的創作平台



vocus|新世代的創作平台










並且跑以下這段程式碼, 記得在前面加入 /content/ 才可以順利抓取到圖片路徑

street_image = '/content/Street.jpg'

載入模型 顯示結果

# 載入 YOLO 模型​
model = YOLO('yolov8n.pt')

# 偵測圖片
results = model(street_image)

# 顯示結果
results[0].show()
vocus|新世代的創作平台






其中可以看見, 在模型的會標示出 motorcycle 和 person 或者 car 還有 bicycle 幾種類別, 旁邊分別為信心指數, 指數越高, 代表模型對於該判斷越有信心!

匯出 csv 檔案

圖片中可以發現所有的分類都是透過框框來顯示, 所以 csv 檔案的結果也會是四個邊框的邊框的相對位置分別為 x1, y1, x2, y2 還有 condifence, 跟分類的標籤和名稱 class_id, class_name

import pandas as pd 

# 提取邊界框資訊
boxes = result[0].boxes

# 將邊界框轉換成更容易處理的格式
bounding_box_data = []
for box in boxes:
x1, y1, x2, y2 = [round(float(val), 2) for val in box.xyxy[0]] # 取得邊界框座標
​confidence = round(float(box.conf[0], 2) # 取得信心分數
class_id = int(box.cls[0]) # 取得類別 ID
class_name = model.names[class.id] # 取得類別名稱

bounding_box_data.append({
'x1': x1,
'y1': y1,
'x2': x2,
'y2': y2,
'confience': confidence,
'class_id': class_id,
'class_name': class_name
})

# 創建 DataFrame
df_detections = pd.DataFrame(bounding_box_data)

# 顯示在下方資訊
display(df_detections)

# 取得提取速度資訊
speed_data = results[0].speed
vocus|新世代的創作平台







最後是匯出 csv 檔案, 則是會顯示在左邊的位置, 可以提供下載並使用。

# 如果您想將偵測結果儲存為 CSV 檔案:

df_detections.to_csv('yolo_detections.csv', index=False)

print("偵測結果已儲存到 yolo_detections.csv")



# 如果您想將速度資訊儲存為 JSON 或其他格式,可以自行處理

import json

with open('yolo_speed.json', 'w') as f:

    json.dump(speed_data, f)

print("處理速度已儲存到 yolo_speed.json")

總結

這邊為簡單透過 YOLO 8 來分類台灣街景內的分類, 雖然模型具有泛化通用的分類, 但若想要提升精確度則需要做個別的訓練, 才能達到更高的水準。



留言
avatar-img
Krist
2會員
11內容數
您好, 目前是軟體工程師 Krist
你可能也想看
Thumbnail
如果不寫程式,我大概會去寫詩,雖然這兩者在本質上是一樣的:都是在一堆符號裡試圖尋找邏輯,然後在凌晨三點崩潰。 今天要聊聊 Google 最近爆紅的 AI 模型——「Nano Banana」(奈米香蕉)。 當你聽到這個名字,你可能會以為這是什麼矽谷
Thumbnail
如果不寫程式,我大概會去寫詩,雖然這兩者在本質上是一樣的:都是在一堆符號裡試圖尋找邏輯,然後在凌晨三點崩潰。 今天要聊聊 Google 最近爆紅的 AI 模型——「Nano Banana」(奈米香蕉)。 當你聽到這個名字,你可能會以為這是什麼矽谷
Thumbnail
在與 Claude Pro 一次漫長的對話互動的過程中,最後我問了一個看似簡單的問題,打算作為結論:「資本平準金是不是可以用來補充資本利得?」這句話本身並不複雜,卻讓 Claude Pro 陷入了一場無限迴圈的推理迷宮,最終甚至觸發使用上限,要求我「 3 小時之後再來」。
Thumbnail
在與 Claude Pro 一次漫長的對話互動的過程中,最後我問了一個看似簡單的問題,打算作為結論:「資本平準金是不是可以用來補充資本利得?」這句話本身並不複雜,卻讓 Claude Pro 陷入了一場無限迴圈的推理迷宮,最終甚至觸發使用上限,要求我「 3 小時之後再來」。
Thumbnail
🧠 從符號邏輯到感知交互:Vibe Coding 時代的工程師再定義 隨著大型語言模型(LLMs)如 GPT-4、Claude、Gemini 進入實用成熟期,我們迎來的不僅是生產力工具的升級,更是一場 編程範式的轉移(paradigm shift)。這場轉變不只是技術演進,更是人機關係、技能定義
Thumbnail
🧠 從符號邏輯到感知交互:Vibe Coding 時代的工程師再定義 隨著大型語言模型(LLMs)如 GPT-4、Claude、Gemini 進入實用成熟期,我們迎來的不僅是生產力工具的升級,更是一場 編程範式的轉移(paradigm shift)。這場轉變不只是技術演進,更是人機關係、技能定義
Thumbnail
《轉轉生》(Re:INCARNATION)為奈及利亞編舞家庫德斯.奧尼奎庫與 Q 舞團創作的當代舞蹈作品,結合拉各斯街頭節奏、Afrobeat/Afrobeats、以及約魯巴宇宙觀的非線性時間,建構出關於輪迴的「誕生—死亡—重生」儀式結構。本文將從約魯巴哲學概念出發,解析其去殖民的身體政治。
Thumbnail
《轉轉生》(Re:INCARNATION)為奈及利亞編舞家庫德斯.奧尼奎庫與 Q 舞團創作的當代舞蹈作品,結合拉各斯街頭節奏、Afrobeat/Afrobeats、以及約魯巴宇宙觀的非線性時間,建構出關於輪迴的「誕生—死亡—重生」儀式結構。本文將從約魯巴哲學概念出發,解析其去殖民的身體政治。
Thumbnail
Google Antigravity 是 Google 釋出的全新 AI 代理人(Agent)型 IDE,讓 AI 不只是寫程式的助手,而是可以「實際操作」你的開發環境、幫你完成任務的真正虛擬工程師。 Antigravity 的核心特點 1. 代理人式 IDE(Agent-First IDE)
Thumbnail
Google Antigravity 是 Google 釋出的全新 AI 代理人(Agent)型 IDE,讓 AI 不只是寫程式的助手,而是可以「實際操作」你的開發環境、幫你完成任務的真正虛擬工程師。 Antigravity 的核心特點 1. 代理人式 IDE(Agent-First IDE)
Thumbnail
背景:從冷門配角到市場主線,算力與電力被重新定價   小P從2008進入股市,每一個時期的投資亮點都不同,記得2009蘋果手機剛上市,當時蘋果只要在媒體上提到哪一間供應鏈,隔天股價就有驚人的表現,當時光學鏡頭非常熱門,因為手機第一次搭上鏡頭可以拍照,也造就傳統相機廠的殞落,如今手機已經全面普及,題
Thumbnail
背景:從冷門配角到市場主線,算力與電力被重新定價   小P從2008進入股市,每一個時期的投資亮點都不同,記得2009蘋果手機剛上市,當時蘋果只要在媒體上提到哪一間供應鏈,隔天股價就有驚人的表現,當時光學鏡頭非常熱門,因為手機第一次搭上鏡頭可以拍照,也造就傳統相機廠的殞落,如今手機已經全面普及,題
Thumbnail
本文分析導演巴里・柯斯基(Barrie Kosky)如何運用極簡的舞臺配置,將布萊希特(Bertolt Brecht)的「疏離效果」轉化為視覺奇觀與黑色幽默,探討《三便士歌劇》在當代劇場中的新詮釋,並藉由舞臺、燈光、服裝、音樂等多方面,分析該作如何在保留批判核心的同時,觸及觀眾的觀看位置與人性幽微。
Thumbnail
本文分析導演巴里・柯斯基(Barrie Kosky)如何運用極簡的舞臺配置,將布萊希特(Bertolt Brecht)的「疏離效果」轉化為視覺奇觀與黑色幽默,探討《三便士歌劇》在當代劇場中的新詮釋,並藉由舞臺、燈光、服裝、音樂等多方面,分析該作如何在保留批判核心的同時,觸及觀眾的觀看位置與人性幽微。
Thumbnail
本文深入探討各種資料模型(關聯式、文件、圖形)及其查詢語言(SQL、MapReduce、Cypher、SPARQL),比較其優缺點及適用場景,並以實際案例說明如何選擇最適合的資料模型與查詢語言。
Thumbnail
本文深入探討各種資料模型(關聯式、文件、圖形)及其查詢語言(SQL、MapReduce、Cypher、SPARQL),比較其優缺點及適用場景,並以實際案例說明如何選擇最適合的資料模型與查詢語言。
Thumbnail
🚀 Google 聯手 Replit:AI 程式革命最大合縱連橫! 對抗 Anthropic、Cursor 的關鍵一役,程式開發者迎來全新武器 📚 目錄 為什麼這件事值得你關注? Google × Replit:官方確認的合作內容 Replit 為什麼變成 Google 想押注的超級平
Thumbnail
🚀 Google 聯手 Replit:AI 程式革命最大合縱連橫! 對抗 Anthropic、Cursor 的關鍵一役,程式開發者迎來全新武器 📚 目錄 為什麼這件事值得你關注? Google × Replit:官方確認的合作內容 Replit 為什麼變成 Google 想押注的超級平
Thumbnail
今年的AI EXPO Taiwan在3月26日至28日於台北圓山花博爭豔館舉辦,因為排課的關係,我在最後一天的時候前往參觀。雖然這場展覽主要是一個B2B的展覽,不過,由於有以前當工程師的經驗,有些議題我也還是蠻感興趣,而如果能收集各種情報,或者能有一些可以從學界出發掌握的機會,我想也是很不錯的。
Thumbnail
今年的AI EXPO Taiwan在3月26日至28日於台北圓山花博爭豔館舉辦,因為排課的關係,我在最後一天的時候前往參觀。雖然這場展覽主要是一個B2B的展覽,不過,由於有以前當工程師的經驗,有些議題我也還是蠻感興趣,而如果能收集各種情報,或者能有一些可以從學界出發掌握的機會,我想也是很不錯的。
Thumbnail
這是一場修復文化與重建精神的儀式,觀眾不需要完全看懂《遊林驚夢:巧遇Hagay》,但你能感受心與土地團聚的渴望,也不急著在此處釐清或定義什麼,但你的在場感受,就是一條線索,關於如何找著自己的路徑、自己的聲音。
Thumbnail
這是一場修復文化與重建精神的儀式,觀眾不需要完全看懂《遊林驚夢:巧遇Hagay》,但你能感受心與土地團聚的渴望,也不急著在此處釐清或定義什麼,但你的在場感受,就是一條線索,關於如何找著自己的路徑、自己的聲音。
Thumbnail
最近正在進行期中考題的出題,並且在設計大語言模型這門選修課和資料結構這門必修課的作業的時候,我一直在想一個核心的問題:同學們需要什麼樣的能力,讓他們在畢業之後可以用來當作面對如今變化多端的業界的武器?程式設計師會被AI時代淘汰嗎? 可以用ChatGPT寫作業嗎? 由於ChatGPT等強大的基於大
Thumbnail
最近正在進行期中考題的出題,並且在設計大語言模型這門選修課和資料結構這門必修課的作業的時候,我一直在想一個核心的問題:同學們需要什麼樣的能力,讓他們在畢業之後可以用來當作面對如今變化多端的業界的武器?程式設計師會被AI時代淘汰嗎? 可以用ChatGPT寫作業嗎? 由於ChatGPT等強大的基於大
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News