使用 YOLO v8 建立基本圖片辨識並匯出 CSV 資料檔案

蔡硯丞

發佈於KT 數據地圖

2025/12/26 更新2025/12/26 發佈閱讀 5 分鐘

目的

這次主題是要使用 YOLO 8 來建立基本圖片辨識, 並且產出 csv 的資料檔案。

步驟

進入 COLAB

首先需要先進入 google 的 colab, 就可以省掉安裝 python 的環境, 全部的內容皆在雲端跑, 也不會吃電腦太多的資源。

安裝 YOLO 8

!pip install ultralytics

這個指令主要是用來安裝 YOLO 的套件, 可以看見執行後會 import 很多套件, 用於之後圖片分類辨識的基礎

Import 需要的資源

from ultralytics import YOLO
import cv2
from matplotlib import pyplot as pyplot

讀取圖片

將圖片內容放入左邊的檔案當中

並且跑以下這段程式碼, 記得在前面加入 /content/ 才可以順利抓取到圖片路徑

street_image = '/content/Street.jpg'

載入模型顯示結果

# 載入 YOLO 模型
model = YOLO('yolov8n.pt')

# 偵測圖片
results = model(street_image)

# 顯示結果
results[0].show()

其中可以看見, 在模型的會標示出 motorcycle 和 person 或者 car 還有 bicycle 幾種類別, 旁邊分別為信心指數, 指數越高, 代表模型對於該判斷越有信心!

匯出 csv 檔案

圖片中可以發現所有的分類都是透過框框來顯示, 所以 csv 檔案的結果也會是四個邊框的邊框的相對位置分別為 x1, y1, x2, y2 還有 condifence, 跟分類的標籤和名稱 class_id, class_name

import pandas as pd 

# 提取邊界框資訊
boxes = result[0].boxes

# 將邊界框轉換成更容易處理的格式
bounding_box_data = []
for box in boxes:
	x1, y1, x2, y2 = [round(float(val), 2) for val in box.xyxy[0]] # 取得邊界框座標
	confidence = round(float(box.conf[0], 2) # 取得信心分數
	class_id = int(box.cls[0]) # 取得類別 ID
	class_name = model.names[class.id] # 取得類別名稱
	
	bounding_box_data.append({
		'x1': x1,
		'y1': y1,
		'x2': x2,
		'y2': y2,
		'confience': confidence,
		'class_id': class_id,
		'class_name': class_name
		})
	
# 創建 DataFrame
df_detections = pd.DataFrame(bounding_box_data)

# 顯示在下方資訊
display(df_detections)

# 取得提取速度資訊
speed_data = results[0].speed

最後是匯出 csv 檔案, 則是會顯示在左邊的位置, 可以提供下載並使用。

# 如果您想將偵測結果儲存為 CSV 檔案：

df_detections.to_csv('yolo_detections.csv', index=False)

print("偵測結果已儲存到 yolo_detections.csv")



# 如果您想將速度資訊儲存為 JSON 或其他格式，可以自行處理

import json

with open('yolo_speed.json', 'w') as f:

    json.dump(speed_data, f)

print("處理速度已儲存到 yolo_speed.json")

總結

這邊為簡單透過 YOLO 8 來分類台灣街景內的分類, 雖然模型具有泛化通用的分類, 但若想要提升精確度則需要做個別的訓練, 才能達到更高的水準。

留言

Krist

2會員

11內容數

您好, 目前是軟體工程師 Krist

你可能也想看

工程師觀察日記

凌晨兩點半的工程師都在幹嘛？Google 告訴你，他們在想香蕉

如果不寫程式，我大概會去寫詩，雖然這兩者在本質上是一樣的：都是在一堆符號裡試圖尋找邏輯，然後在凌晨三點崩潰。今天要聊聊 Google 最近爆紅的 AI 模型——「Nano Banana」（奈米香蕉）。當你聽到這個名字，你可能會以為這是什麼矽谷

#Google#Flash#凌晨

2025/11/26

工程師觀察日記

凌晨兩點半的工程師都在幹嘛？Google 告訴你，他們在想香蕉

#Google#Flash#凌晨

2025/11/26

Stan Wu 吳信典

為什麼 Claude 轉向程式語言？揭開大型語言模型無法「收斂」的真相

在與 Claude Pro 一次漫長的對話互動的過程中，最後我問了一個看似簡單的問題，打算作為結論：「資本平準金是不是可以用來補充資本利得？」這句話本身並不複雜，卻讓 Claude Pro 陷入了一場無限迴圈的推理迷宮，最終甚至觸發使用上限，要求我「 3 小時之後再來」。

#語言#模型#程式

2025/07/31

Stan Wu 吳信典

為什麼 Claude 轉向程式語言？揭開大型語言模型無法「收斂」的真相

#語言#模型#程式

2025/07/31

iBonnie_愛邦尼

6 大主流 Vibe Coding 工具比較（含矽谷採用案例）

🧠 從符號邏輯到感知交互：Vibe Coding 時代的工程師再定義隨著大型語言模型（LLMs）如 GPT-4、Claude、Gemini 進入實用成熟期，我們迎來的不僅是生產力工具的升級，更是一場編程範式的轉移（paradigm shift）。這場轉變不只是技術演進，更是人機關係、技能定義

#語言#工程師#程式

2025/06/19

iBonnie_愛邦尼

6 大主流 Vibe Coding 工具比較（含矽谷採用案例）

#語言#工程師#程式

2025/06/19

詹育杰的沙龍

《轉轉生 Re:INCARNATION》：Qudus Onikeku、約魯巴哲學與 Afrobeat 的去殖民身體政治

《轉轉生》（Re:INCARNATION）為奈及利亞編舞家庫德斯．奧尼奎庫與 Q 舞團創作的當代舞蹈作品，結合拉各斯街頭節奏、Afrobeat／Afrobeats、以及約魯巴宇宙觀的非線性時間，建構出關於輪迴的「誕生—死亡—重生」儀式結構。本文將從約魯巴哲學概念出發，解析其去殖民的身體政治。

#2026北藝嚴選#北藝嚴選#臺北表演藝術中心

2026/02/05

詹育杰的沙龍

《轉轉生 Re:INCARNATION》：Qudus Onikeku、約魯巴哲學與 Afrobeat 的去殖民身體政治

#2026北藝嚴選#北藝嚴選#臺北表演藝術中心

2026/02/05

Hank吳的沙龍

Google Antigravity 是什麼？為何被視為重大突破

Google Antigravity 是 Google 釋出的全新 AI 代理人（Agent）型 IDE，讓 AI 不只是寫程式的助手，而是可以「實際操作」你的開發環境、幫你完成任務的真正虛擬工程師。 Antigravity 的核心特點 1. 代理人式 IDE（Agent-First IDE）

#Google#核心#開發

2025/11/19

Hank吳的沙龍

Google Antigravity 是什麼？為何被視為重大突破

#Google#核心#開發

2025/11/19

小P趨勢投資

算力的盡頭是電力！009819 小P量化交易者眼中的AI基建雙引擎致勝邏輯

背景：從冷門配角到市場主線，算力與電力被重新定價小P從2008進入股市，每一個時期的投資亮點都不同，記得2009蘋果手機剛上市，當時蘋果只要在媒體上提到哪一間供應鏈，隔天股價就有驚人的表現，當時光學鏡頭非常熱門，因為手機第一次搭上鏡頭可以拍照，也造就傳統相機廠的殞落，如今手機已經全面普及，題

#AI#算力#電力

2026/04/11

小P趨勢投資

算力的盡頭是電力！009819 小P量化交易者眼中的AI基建雙引擎致勝邏輯

#AI#算力#電力

2026/04/11

陳沅綦的沙龍

柏林劇團《三便士歌劇》：巴里．柯斯基的經典再造，與布萊希特劇場的當代轉向

本文分析導演巴里・柯斯基（Barrie Kosky）如何運用極簡的舞臺配置，將布萊希特（Bertolt Brecht）的「疏離效果」轉化為視覺奇觀與黑色幽默，探討《三便士歌劇》在當代劇場中的新詮釋，並藉由舞臺、燈光、服裝、音樂等多方面，分析該作如何在保留批判核心的同時，觸及觀眾的觀看位置與人性幽微。

#2026北藝嚴選#北藝嚴選#臺北表演藝術中心

2026/02/11