「親手訓練」一個專屬於你的影像辨識模型

更新 發佈閱讀 3 分鐘

Teachable Machine 是 Google 開發的一個網站工具,它的目標就是讓每個人都能體驗「訓練 AI」的過程,超級簡單!

我們的目標:訓練一個能分辨「你的手比讚 👍」和「你的手比 OK 👌」的 AI 模型。



訓練 AI 超級三步驟


請在電腦上打開這個網址:Teachable Machine

點擊藍色的 [開始使用] 按鈕,然後選擇 [圖片專案],再選擇 [標準圖片模型]

你會看到一個很清爽的畫面,主要分成三個區塊,我們就照著這三步來做:



第一步:建立分類並「餵」給 AI 範例 (提供訓練資料)


就像我們教寶寶認蘋果一樣,我們要先給電腦看大量的範例。

  1. 建立第一個分類:「讚」 👍
    • 找到 Class 1,點擊旁邊的鉛筆符號,把它改名叫做「讚」。
    • 點擊 [網路攝影機] 按鈕,允許瀏覽器使用你的鏡頭。
    • 接著,對著鏡頭比出你的大拇指 👍。
    • 按住 [按住以錄製] 的按鈕不放,同時可以稍微動一下你的手,換換角度、遠近、左右手,讓 AI 盡量學習不同角度的「讚」。錄製個 100~200 張圖片就很棒了!
  2. 建立第二個分類:「OK」 👌
    • 點擊下方的 [新增類別]。
    • 同樣地,把 Class 2 改名叫做「OK」。
    • 點擊 [網路攝影機],這次對著鏡頭比出 OK 的手勢 👌。
    • 一樣按住 [按住以錄製],盡量從不同角度錄製 100~200 張「OK」的範例圖片。

小提示:你也可以新增一個「沒有東西」的分類,錄製沒有手、只有背景的畫面。這樣可以讓 AI 在你沒比手勢的時候,不會亂猜是「讚」或「OK」。



第二步:訓練模型


這一步最簡單,因為電腦會幫我們搞定!

  1. 點擊畫面中間的 [訓練模型] 按鈕。
  2. 你會看到一個小小的提示:「請勿切換分頁」。這時候電腦正在非常努力地學習你剛剛給它的所有圖片,試圖找出「讚」和「OK」各自的「樂高零件組合」。
  3. 訓練需要一點時間,通常一分鐘內就會完成。耐心等待一下! *


第三步:測試與預覽


訓練完成後,神奇的時刻來了!

  • 右邊的「預覽」視窗會啟動你的攝影機。
  • 現在,對著鏡頭比出一個「讚」👍。看看下方的輸出結果,是不是「讚」的信賴度長條圖衝到最高?
  • 接著,換成比一個「OK」👌。看看是不是「OK」的長條圖衝上來了?
  • 你也可以試試看比一個「YA」✌️,看看 AI 會怎麼反應?(它可能會在「讚」和「OK」之間猶豫,因為它從沒學過這個!) *

恭喜你!你剛剛親手完成了訓練一個影像辨識 AI 的完整流程!

是不是很有成就感?

這個簡單的實驗完美地展示了我們之前聊到的概念:

  • 提供資料 (大量的讚和OK手勢圖片)。
  • 電腦從中學習 (訓練模型)。
  • 最後能對新的、沒見過的資料做出預測 (在你測試時,即時辨識你的手勢)。
留言
avatar-img
Hank吳的沙龍
17會員
161內容數
這不僅僅是一個 Blog,更是一個交流與分享的空間。 期待在這裡與你相遇,一起探索科技、體驗生活、夢想旅行!💖
Hank吳的沙龍的其他內容
2025/07/17
影像辨識技術如何運作?本文以樂高積木為例,深入淺出地解釋電腦如何從像素數據中學習並辨識圖像,並列舉生活中影像辨識的應用實例,例如人臉解鎖、車牌辨識、醫療影像分析和自動駕駛等。
Thumbnail
2025/07/17
影像辨識技術如何運作?本文以樂高積木為例,深入淺出地解釋電腦如何從像素數據中學習並辨識圖像,並列舉生活中影像辨識的應用實例,例如人臉解鎖、車牌辨識、醫療影像分析和自動駕駛等。
Thumbnail
2025/07/17
自然語言處理(NLP)讓電腦能像人一樣理解、詮釋和生成人類語言。本文以機器人助理為例,說明NLP的四個步驟:認識詞彙、分析句子結構、理解語意與情境,以及得體地回應。並列舉手機語音助理、線上翻譯、聊天機器人、輸入法自動選字等NLP應用實例。
Thumbnail
2025/07/17
自然語言處理(NLP)讓電腦能像人一樣理解、詮釋和生成人類語言。本文以機器人助理為例,說明NLP的四個步驟:認識詞彙、分析句子結構、理解語意與情境,以及得體地回應。並列舉手機語音助理、線上翻譯、聊天機器人、輸入法自動選字等NLP應用實例。
Thumbnail
2025/07/17
這篇文章以淺顯易懂的方式解釋機器學習的原理,以教寶寶認蘋果為例,說明機器學習如何透過大量數據、標籤和演算法,讓電腦從數據中學習模式並進行預測。文章也舉出垃圾郵件過濾、影片推薦系統和手機相簿的人物分類等生活中的例子,幫助讀者理解機器學習的應用。
Thumbnail
2025/07/17
這篇文章以淺顯易懂的方式解釋機器學習的原理,以教寶寶認蘋果為例,說明機器學習如何透過大量數據、標籤和演算法,讓電腦從數據中學習模式並進行預測。文章也舉出垃圾郵件過濾、影片推薦系統和手機相簿的人物分類等生活中的例子,幫助讀者理解機器學習的應用。
Thumbnail
看更多
你可能也想看
Thumbnail
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 我們已經在 AI說書 - 從0開始 - 114 建立了 Transformer 模型。 現在我們來載入預訓練權重,預訓練的權重包含 Transformer 的智慧
Thumbnail
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 我們已經在 AI說書 - 從0開始 - 114 建立了 Transformer 模型。 現在我們來載入預訓練權重,預訓練的權重包含 Transformer 的智慧
Thumbnail
這篇文章介紹瞭如何利用生成式AI(GenAI)來提高學習效率,包括文章重點整理、完善知識體系、客製化學習回饋、提供多元觀點等方法。同時提醒使用者應注意內容的信效度,保持學術誠信,適當運用GenAI能大幅提升工作效率。
Thumbnail
這篇文章介紹瞭如何利用生成式AI(GenAI)來提高學習效率,包括文章重點整理、完善知識體系、客製化學習回饋、提供多元觀點等方法。同時提醒使用者應注意內容的信效度,保持學術誠信,適當運用GenAI能大幅提升工作效率。
Thumbnail
5 月將於臺北表演藝術中心映演的「2026 北藝嚴選」《海妲・蓋柏樂》,由臺灣劇團「晃晃跨幅町」製作,本文將以從舞台符號、聲音與表演調度切入,討論海妲・蓋柏樂在父權社會結構下的困境,並結合榮格心理學與馮.法蘭茲對「阿尼姆斯」與「永恆少年」原型的分析,理解女人何以走向精神性的操控、毀滅與死亡。
Thumbnail
5 月將於臺北表演藝術中心映演的「2026 北藝嚴選」《海妲・蓋柏樂》,由臺灣劇團「晃晃跨幅町」製作,本文將以從舞台符號、聲音與表演調度切入,討論海妲・蓋柏樂在父權社會結構下的困境,並結合榮格心理學與馮.法蘭茲對「阿尼姆斯」與「永恆少年」原型的分析,理解女人何以走向精神性的操控、毀滅與死亡。
Thumbnail
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 我們已經在 AI說書 - 從0開始 - 114 建立了 Transformer 模型,並在 AI說書 - 從0開始 - 115 載入權重並執行 Tokenizing,現
Thumbnail
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 我們已經在 AI說書 - 從0開始 - 114 建立了 Transformer 模型,並在 AI說書 - 從0開始 - 115 載入權重並執行 Tokenizing,現
Thumbnail
本文分析導演巴里・柯斯基(Barrie Kosky)如何運用極簡的舞臺配置,將布萊希特(Bertolt Brecht)的「疏離效果」轉化為視覺奇觀與黑色幽默,探討《三便士歌劇》在當代劇場中的新詮釋,並藉由舞臺、燈光、服裝、音樂等多方面,分析該作如何在保留批判核心的同時,觸及觀眾的觀看位置與人性幽微。
Thumbnail
本文分析導演巴里・柯斯基(Barrie Kosky)如何運用極簡的舞臺配置,將布萊希特(Bertolt Brecht)的「疏離效果」轉化為視覺奇觀與黑色幽默,探討《三便士歌劇》在當代劇場中的新詮釋,並藉由舞臺、燈光、服裝、音樂等多方面,分析該作如何在保留批判核心的同時,觸及觀眾的觀看位置與人性幽微。
Thumbnail
在學習描寫文的過程中,將思維視覺化是一個重要的教學策略。通過使用AI生成圖片功能,教師能夠幫助學生將抽象的描述轉化為具體的圖像。
Thumbnail
在學習描寫文的過程中,將思維視覺化是一個重要的教學策略。通過使用AI生成圖片功能,教師能夠幫助學生將抽象的描述轉化為具體的圖像。
Thumbnail
前言 讀了許多理論,是時候實際動手做做看了,以下是我的模型訓練初體驗,有點糟就是了XD。 正文 def conv(filters, kernel_size, strides=1): return Conv2D(filters, kernel_size,
Thumbnail
前言 讀了許多理論,是時候實際動手做做看了,以下是我的模型訓練初體驗,有點糟就是了XD。 正文 def conv(filters, kernel_size, strides=1): return Conv2D(filters, kernel_size,
Thumbnail
筆記-曲博談AI模型.群聯-24.05.05 https://www.youtube.com/watch?v=JHE88hwx4b0&t=2034s *大型語言模型 三個步驟: 1.預訓練,訓練一次要用幾萬顆處理器、訓練時間要1個月,ChatGPT訓練一次的成本為1000萬美金。 2.微調(
Thumbnail
筆記-曲博談AI模型.群聯-24.05.05 https://www.youtube.com/watch?v=JHE88hwx4b0&t=2034s *大型語言模型 三個步驟: 1.預訓練,訓練一次要用幾萬顆處理器、訓練時間要1個月,ChatGPT訓練一次的成本為1000萬美金。 2.微調(
Thumbnail
背景:從冷門配角到市場主線,算力與電力被重新定價   小P從2008進入股市,每一個時期的投資亮點都不同,記得2009蘋果手機剛上市,當時蘋果只要在媒體上提到哪一間供應鏈,隔天股價就有驚人的表現,當時光學鏡頭非常熱門,因為手機第一次搭上鏡頭可以拍照,也造就傳統相機廠的殞落,如今手機已經全面普及,題
Thumbnail
背景:從冷門配角到市場主線,算力與電力被重新定價   小P從2008進入股市,每一個時期的投資亮點都不同,記得2009蘋果手機剛上市,當時蘋果只要在媒體上提到哪一間供應鏈,隔天股價就有驚人的表現,當時光學鏡頭非常熱門,因為手機第一次搭上鏡頭可以拍照,也造就傳統相機廠的殞落,如今手機已經全面普及,題
Thumbnail
這是一場修復文化與重建精神的儀式,觀眾不需要完全看懂《遊林驚夢:巧遇Hagay》,但你能感受心與土地團聚的渴望,也不急著在此處釐清或定義什麼,但你的在場感受,就是一條線索,關於如何找著自己的路徑、自己的聲音。
Thumbnail
這是一場修復文化與重建精神的儀式,觀眾不需要完全看懂《遊林驚夢:巧遇Hagay》,但你能感受心與土地團聚的渴望,也不急著在此處釐清或定義什麼,但你的在場感受,就是一條線索,關於如何找著自己的路徑、自己的聲音。
Thumbnail
在機器學習領域中,監督學習、無監督學習和強化學習是三種核心方法,它們在解決不同類型的問題時發揮著重要作用。
Thumbnail
在機器學習領域中,監督學習、無監督學習和強化學習是三種核心方法,它們在解決不同類型的問題時發揮著重要作用。
Thumbnail
延續上週提到的,「有哪些不訓練模型的情況下,能夠強化語言模型的能力」,這堂課接續介紹其中第 3、4 個方法
Thumbnail
延續上週提到的,「有哪些不訓練模型的情況下,能夠強化語言模型的能力」,這堂課接續介紹其中第 3、4 個方法
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News